Dominando a engenharia RAG8 / 10

Tratando Alucinações e Guardrails

Quando a recuperação vem vazia, um modelo prestativo inventa. Guardrails transformam 'confiantemente errado' em 'honestamente incerto' — a diferença que os usuários realmente confiam.

Publicado em 17 de mai. de 20261 min de leituraHaythem Rehouma · Claude Mastery

Uma alucinação em RAG é geralmente uma falha de recuperação disfarçada: o modelo recebeu contexto fraco ou irrelevante e — treinado para ser prestativo — preencheu o vazio com invenção. Guardrails tornam essa falha visível em vez de fluente.

Gate na confiança de recuperação

Antes de gerar, verifique a recuperação. Se a pontuação do top re-ranked estiver abaixo de um limiar, ou nenhum chunk passar por uma barra de relevância, não gere uma resposta confiante — retorne "Não consegui encontrar isso nas fontes" ou escale.

if top_score < THRESHOLD:
    return "I don't have a reliable source for that."

O limiar é ajustado contra as questões fora do escopo do seu conjunto de avaliação.

Verifique a saída, não apenas a entrada

Após a geração, execute uma verificação de fidelidade: cada afirmação rastreia até um chunk recuperado? Uma segunda chamada de modelo barata ("Esta resposta é totalmente apoiada por essas fontes? Liste as afirmações não apoiadas.") detecta desvios antes de chegar ao usuário.

Falhe graciosamente

Honesto sob incerteza, fundamentado quando confiante. Próximo: mantendo tudo isso acessível.

Gate na confiança de recuperação

Verifique a saída, não apenas a entrada

Falhe graciosamente

Compartilhar este artigo

Série — Dominando a engenharia RAG

Continue aprendendo

O curso Claude Mastery