Vector Database: Guía para Principiantes [2026]

Q: ¿Qué dimensión de embeddings usar?

1536 es el estándar con text-embedding-3-small de OpenAI. Usa la dimensión que devuelva tu modelo de embeddings.

Q: ¿Vector DB reemplaza a SQL?

No. Usa vector DB para búsqueda semántica y SQL para datos estructurados. Muchas apps usan ambas.

Q: ¿Cuál es más rápida?

Qdrant y Milvus son las más rápidas para grandes volúmenes. Para < 1M vectores, todas son suficientemente rápidas.

TLDR: Una base de datos vectorial almacena embeddings para búsqueda por similitud semántica. Esencial para RAG, recomendaciones y búsqueda semántica. Opciones: Chroma (gratis, local), Pinecone (cloud fácil), pgvector (si ya usas Postgres).

Qué es una vector database {#que-es}

Una base de datos vectorial almacena y busca vectores (embeddings) de forma eficiente.

Diferencia con SQL tradicional

Tipo	SQL Tradicional	Vector Database
Búsqueda	Exacta (WHERE x = y)	Por similitud
Datos	Texto, números	Vectores (arrays)
Uso típico	CRUD, transacciones	IA, búsqueda semántica
Ejemplo	"Dame usuarios de Madrid"	"Encuentra textos similares a este"

Cómo funciona

code

11. Texto → Embedding → Vector [0.12, -0.34, ...]
22. Vector se guarda en la BD
33. Query → Embedding → Buscar vectores similares
44. Devolver resultados ordenados por similitud

Cuándo necesitas una {#cuando}

Casos de uso

Caso	Descripción	Vector DB necesaria
RAG	Dar contexto a LLMs	✅ Sí
Búsqueda semántica	Buscar por significado	✅ Sí
Recomendaciones	Items similares	✅ Sí
Detección duplicados	Encontrar similares	✅ Sí
Clasificación	Categorizar textos	⚠️ Opcional

Señales de que la necesitas

Tienes más de 10,000 documentos para buscar
Búsqueda por keywords no funciona bien
Construyes un sistema RAG
Necesitas búsqueda en tiempo real con baja latencia

Comparativa de opciones {#comparativa}

Tabla comparativa

Base de datos	Tipo	Precio	Mejor para
Chroma	Local/Cloud	Gratis	Desarrollo, proyectos pequeños
Pinecone	Cloud	Free tier + pago	Producción fácil
Weaviate	Self-hosted/Cloud	Gratis (self)	Control total
Qdrant	Self-hosted/Cloud	Gratis (self)	Alto rendimiento
pgvector	Extensión Postgres	Gratis	Ya usas Postgres
Milvus	Self-hosted	Gratis	Escala masiva

Mi recomendación

Empezando/Desarrollo: Chroma
Producción fácil: Pinecone
Ya tienes Postgres: pgvector
Control total: Weaviate o Qdrant

Tutorial con Chroma {#chroma}

Chroma es la opción más fácil para empezar.

Instalación

bash

1pip install chromadb

Uso básico

python

1import chromadb
2from chromadb.utils import embedding_functions
3 
4# Crear cliente
5client = chromadb.Client()
6 
7# Usar embeddings de OpenAI
8openai_ef = embedding_functions.OpenAIEmbeddingFunction(
9    api_key="sk-...",
10    model_name="text-embedding-3-small"
11)
12 
13# Crear colección
14collection = client.create_collection(
15    name="mis_documentos",
16    embedding_function=openai_ef
17)
18 
19# Añadir documentos
20collection.add(
21    documents=[
22        "Python es un lenguaje de programación",
23        "JavaScript se usa para desarrollo web",
24        "El café es una bebida con cafeína"
25    ],
26    ids=["doc1", "doc2", "doc3"]
27)
28 
29# Buscar
30results = collection.query(
31    query_texts=["lenguajes de programación"],
32    n_results=2
33)
34 
35print(results['documents'])
36# [['Python es un lenguaje de programación',
37#   'JavaScript se usa para desarrollo web']]

Persistir datos

python

1# Cliente con persistencia
2client = chromadb.PersistentClient(path="./chroma_db")
3 
4# Los datos se guardan automáticamente

Tutorial con Pinecone {#pinecone}

Pinecone es la opción más fácil para producción.

Configuración

bash

1pip install pinecone-client

python

1from pinecone import Pinecone, ServerlessSpec
2 
3# Inicializar
4pc = Pinecone(api_key="tu-api-key")
5 
6# Crear índice
7pc.create_index(
8    name="mi-indice",
9    dimension=1536,  # dimensión de text-embedding-3-small
10    metric="cosine",
11    spec=ServerlessSpec(
12        cloud="aws",
13        region="us-east-1"
14    )
15)
16 
17# Conectar al índice
18index = pc.Index("mi-indice")

Insertar y buscar

python

1from openai import OpenAI
2 
3openai = OpenAI()
4 
5def get_embedding(text):
6    response = openai.embeddings.create(
7        model="text-embedding-3-small",
8        input=text
9    )
10    return response.data[0].embedding
11 
12# Insertar
13documents = [
14    {"id": "1", "text": "Python es genial"},
15    {"id": "2", "text": "JavaScript para web"},
16]
17 
18vectors = []
19for doc in documents:
20    embedding = get_embedding(doc["text"])
21    vectors.append({
22        "id": doc["id"],
23        "values": embedding,
24        "metadata": {"text": doc["text"]}
25    })
26 
27index.upsert(vectors=vectors)
28 
29# Buscar
30query_embedding = get_embedding("programación")
31results = index.query(
32    vector=query_embedding,
33    top_k=3,
34    include_metadata=True
35)
36 
37for match in results["matches"]:
38    print(f"{match['score']:.3f}: {match['metadata']['text']}")

Tutorial con pgvector {#pgvector}

Si ya usas PostgreSQL, pgvector es ideal.

Instalación

sql

1-- En PostgreSQL
2CREATE EXTENSION vector;

Crear tabla

sql

1CREATE TABLE documents (
2    id SERIAL PRIMARY KEY,
3    content TEXT,
4    embedding vector(1536)
5);

Insertar y buscar (Python)

python

1import psycopg2
2from openai import OpenAI
3 
4openai = OpenAI()
5conn = psycopg2.connect("postgresql://...")
6cur = conn.cursor()
7 
8def get_embedding(text):
9    response = openai.embeddings.create(
10        model="text-embedding-3-small",
11        input=text
12    )
13    return response.data[0].embedding
14 
15# Insertar
16text = "Python es un lenguaje de programación"
17embedding = get_embedding(text)
18 
19cur.execute(
20    "INSERT INTO documents (content, embedding) VALUES (%s, %s)",
21    (text, embedding)
22)
23conn.commit()
24 
25# Buscar (similitud coseno)
26query = "lenguajes de código"
27query_embedding = get_embedding(query)
28 
29cur.execute("""
30    SELECT content, 1 - (embedding <=> %s::vector) as similarity
31    FROM documents
32    ORDER BY embedding <=> %s::vector
33    LIMIT 5
34""", (query_embedding, query_embedding))
35 
36for row in cur.fetchall():
37    print(f"{row[1]:.3f}: {row[0]}")

FAQ {#faq}

¿Cuántos vectores puedo almacenar gratis?

Servicio	Free tier
Pinecone	100K vectores
Chroma	Ilimitado (local)
Qdrant	Ilimitado (self-hosted)
pgvector	Ilimitado

¿Qué dimensión de embeddings usar?

1536 es el estándar con text-embedding-3-small de OpenAI. Usa la dimensión que devuelva tu modelo de embeddings.

¿Vector DB reemplaza a SQL?

No. Usa vector DB para búsqueda semántica y SQL para datos estructurados. Muchas apps usan ambas.

¿Cuál es más rápida?

Qdrant y Milvus son las más rápidas para grandes volúmenes. Para < 1M vectores, todas son suficientemente rápidas.

Conclusión

Las bases de datos vectoriales son esenciales para IA moderna:

Chroma para empezar y proyectos pequeños
Pinecone para producción sin complicaciones
pgvector si ya tienes PostgreSQL
Qdrant/Weaviate para control total

Recursos relacionados:

Más contenido técnico en Javadex.es

Síguenos: YouTube @JavadexAI | TikTok @javadex

Vector Database: Guía para Principiantes [2026]

Vector Database: Guía para Principiantes [2026]

Tabla de Contenidos

Qué es una vector database {#que-es}

Diferencia con SQL tradicional

Cómo funciona

Cuándo necesitas una {#cuando}

Casos de uso

Señales de que la necesitas

Comparativa de opciones {#comparativa}

Tabla comparativa

Mi recomendación

Tutorial con Chroma {#chroma}

Instalación

Uso básico

Persistir datos

Tutorial con Pinecone {#pinecone}

Configuración

Insertar y buscar

Tutorial con pgvector {#pgvector}

Instalación

Crear tabla

Insertar y buscar (Python)

FAQ {#faq}

¿Cuántos vectores puedo almacenar gratis?

¿Qué dimensión de embeddings usar?

¿Vector DB reemplaza a SQL?

¿Cuál es más rápida?

Conclusión

Posts Relacionados

Cómo Usar Claude Code en Terminal: Tutorial Paso a Paso [2026]

MCP Servers para Claude: Guía de Configuración en Español [2026]

Gemini 3 Deep Think: Cómo Usar el Modo Razonamiento de Google [2026]

Javier Santos Criado

¿Quieres más contenido de IA?