Maîtriser l'ingénierie RAG8 / 10

Gestion des hallucinations et garde-fous

Quand la récupération ne trouve rien, un modèle utile invente. Les garde-fous transforment « confidemment faux » en « honnêtement incertain » — la différence que les utilisateurs font confiance.

Publié le 17 mai 20261 min de lectureHaythem Rehouma · Claude Mastery

Une hallucination en RAG est généralement un échec de récupération déguisé : le modèle a obtenu un contexte faible ou non pertinent, et — entraîné à être utile — a comblé le vide par l'invention. Les garde-fous rendent cet échec visible au lieu de fluide.

Gating sur la confiance de récupération

Avant de générer, vérifiez la récupération. Si le score réclassé le plus élevé est en dessous d'un seuil, ou si aucun chunk ne dépasse une barre de pertinence, ne générez pas une réponse confiante — retournez « Je n'ai pas trouvé cela dans les sources » ou escaladez.

if top_score < THRESHOLD:
    return "I don't have a reliable source for that."

Le seuil est ajusté par rapport aux questions hors champ de votre ensemble d'évaluation.

Vérifiez la sortie, pas seulement l'entrée

Après génération, exécutez une vérification de fidélité : chaque affirmation remonte-t-elle à un chunk récupéré ? Un deuxième appel de modèle bon marché (« Cette réponse est-elle entièrement soutenue par ces sources ? Énumérez les affirmations non soutenues. ») capture la dérive avant qu'elle n'atteigne l'utilisateur.

Échouez gracieusement

Honnête sous l'incertitude, fondé quand confiant. Ensuite : maintenir tout cela abordable.

Gating sur la confiance de récupération

Vérifiez la sortie, pas seulement l'entrée

Échouez gracieusement

Partager cet article

Série — Maîtriser l'ingénierie RAG

Continuer

Le cours Claude Mastery