Dominando a engenharia RAG3 / 10

Embeddings & Vector Stores 101

Um embedding transforma significado em geometria. Uma vector store torna essa geometria pesquisável em milissegundos. Acerte ambos e a recuperação fica fácil.

Publicado em 7 de mai. de 20261 min de leituraHaythem Rehouma · Claude Mastery

Um embedding mapeia texto para um ponto em espaço de alta dimensionalidade onde proximidade significa significado similar. Recuperação é então apenas "encontre os pontos mais próximos dessa pergunta." Tudo o mais é encanamento.

Escolhendo um modelo

Qualidade vs. custo — modelos maiores fazem embed de nuances melhor mas custam mais por token e por query.
Dimensões — mais dimensões podem capturar mais, mas custam armazenamento e tempo de busca. Muitos sistemas em produção ficam em 768–1536.
Consistência — faça embed de seus documentos e suas queries com o mesmo modelo. Misturar modelos embaralha a geometria.

Onde armazená-los

pgvector (Postgres) — se você já roda Postgres, comece aqui. Um banco de dados, transacional, filtrável por metadados com SQL puro.
Vector DBs dedicados — recorra a eles em larga escala ou quando você precisa de features de índice especializadas. Não comece aqui para um primeiro produto.

Índices mantêm isso rápido

Busca exata de vizinho mais próximo é O(n) — ok em 10k vetores, dolorosa em 10M. Índices approximate nearest-neighbour (ANN) (HNSW, IVPFlat) trocam um fio de recall por velocidade de ordens de magnitude.

Vetores sozinhos perdem termos exatos e palavras-chave raras. Próximo: combiná-los com busca por palavra-chave — retrieval híbrido.

Escolhendo um modelo

Onde armazená-los

Índices mantêm isso rápido

Skills do Claude relacionadas para instalar

Compartilhar este artigo

Série — Dominando a engenharia RAG

Continue aprendendo

database

O curso Claude Mastery