Dominando a engenharia RAG4 / 10

Hybrid Retrieval — Keyword + Vector

Vector search compreende significado mas tropeça em termos exatos, IDs e palavras raras. Keyword search acerta nesses e erra em paráfrase. Use ambos.

Publicado em 9 de mai. de 20261 min de leituraHaythem Rehouma · Claude Mastery

Vector search é ótimo em "o que isso significa" e ruim em "encontre o chunk que literalmente diz ERR_CONN_4032." Keyword search é o oposto. RAG em produção usa ambos.

Onde cada um vence

Vector — paráfrase, conceitos, "como faço para cancelar" correspondendo a "rescisão de inscrição".
Keyword (BM25) — termos exatos, códigos de erro, nomes de produtos, acrônimos, jargão raro que o embedding suaviza.

Execute ambos para cada query; você obtém duas listas classificadas.

Fundindo as listas com RRF

Reciprocal Rank Fusion combina listas classificadas sem precisar de scores comparáveis: cada documento recebe 1 / (k + rank) de cada lista, somado. Documentos que classificam bem em qualquer lista sobem; documentos fortes em ambos dominam.

score(doc) = Σ  1 / (k + rank_in_list_i)     # k ≈ 60

É algumas linhas de código, não precisa de calibração de score, e supera consistentemente qualquer retriever isolado.

Onde cada um vence

Fundindo as listas com RRF

Compartilhar este artigo

Série — Dominando a engenharia RAG

Continue aprendendo

O curso Claude Mastery