Dominar la ingeniería RAG3 / 10

Embeddings & Vector Stores 101

Un embedding convierte significado en geometría. Un vector store hace esa geometría buscable en milisegundos. Acertar en ambos hace que la recuperación sea sencilla.

Publicado el 7 may 20261 min de lecturaHaythem Rehouma · Claude Mastery

Un embedding mapea texto a un punto en espacio de alta dimensionalidad donde la proximidad significa significado similar. La recuperación es entonces solo "encontrar los puntos más cercanos a esta pregunta". Todo lo demás es fontanería.

Elegir un modelo

Calidad vs. costo — los modelos más grandes capturan mejor los matices pero cuestan más por token y por consulta.
Dimensiones — más dimensiones pueden capturar más, pero cuestan almacenamiento y tiempo de búsqueda. Muchos sistemas en producción se sitúan en 768–1536.
Consistencia — embebe tus documentos y tus consultas con el mismo modelo. Mezclar modelos desordena la geometría.

Dónde almacenarlos

pgvector (Postgres) — si ya ejecutas Postgres, empieza aquí. Una base de datos, transaccional, filtrable por metadatos con SQL plano.
Vector DBs dedicadas — recurre a ellas a gran escala o cuando necesites características de índice especializadas. No empieces aquí para un primer producto.

Los índices la mantienen rápida

La búsqueda exacta del vecino más cercano es O(n) — correcta con 10k vectores, penosa con 10M. Los índices de approximate nearest-neighbour (ANN) (HNSW, IVFFlat) intercambian un ápice de recall por órdenes de magnitud de velocidad.

Los vectores solos pierden términos exactos y palabras clave raras. Siguiente: combinarlos con búsqueda por palabras clave — recuperación híbrida.

Elegir un modelo

Dónde almacenarlos

Los índices la mantienen rápida

Skills de Claude relacionadas para instalar

Compartir este artículo

Serie — Dominar la ingeniería RAG

Sigue aprendiendo

database

El curso Claude Mastery