Skip to content

إتقان هندسة RAG8 / 10

التعامل مع الهلوسات والضمانات الأمنية

عندما لا يجد الاسترجاع شيئاً، ينسج النموذج الذكي إجابات من العدم. الضمانات الأمنية تحول "الخطأ الواثق" إلى "عدم التأكد الصادق" — الفرق الذي يثق به المستخدمون فعلاً.

التعامل مع الهلوسات والضمانات الأمنية

الهلوسة في RAG عادةً ما تكون فشل استرجاع مقنّع: النموذج حصل على سياق ضعيف أو غير صلة، وـ مدرَّباً على أن يكون مفيداً ـ ملأ الفراغ بالاختراع. الضمانات الأمنية تجعل هذا الفشل مرئياً بدلاً من أن يكون بليغاً.

قيّد الثقة بالاسترجاع

قبل التوليد، افحص الاسترجاع. إذا كان أعلى درجة معاد ترتيبها أقل من عتبة معينة، أو لم تتجاوز أي مقطع شريط الصلة، لا توَلّد إجابة واثقة — أعد "لم أتمكن من العثور على هذا في المصادر" أو صعّد الطلب.

if top_score < THRESHOLD:
    return "I don't have a reliable source for that."

يتم ضبط العتبة مقابل أسئلة نطاق خارج البيانات التقييمية الخاصة بك.

تحقق من المخرجات، لا من المدخلات فقط

بعد التوليد، شغّل فحص الصدقية: هل يعود كل ادعاء إلى مقطع مسترجع؟ نداء نموذج ثانٍ رخيص ("هل هذه الإجابة مدعومة بالكامل من هذه المصادر؟ اذكر الادعاءات غير المدعومة.") يُمسك بالانجراف قبل وصوله للمستخدم.

اَرفِض بأناقة

صادق تحت عدم اليقين، مؤسَّس عندما تكون واثقاً. التالي: الحفاظ على كل هذا بتكلفة معقولة.

شارك هذا المقال

#RAG #Eval #AI

LinkedInX / TwitterBlueskyThreadsRedditHacker NewsWhatsAppبريد إلكتروني

السلسلة — إتقان هندسة RAG

  1. الجزء 01لماذا يفشل نظام RAG البسيط في الإنتاجعرض البحث المتجه بـ 50 سطر الذي يبهر في دفتر الملاحظات ينهار في اللحظة التي يطرح فيها المستخدمون الحقيقيون أسئلتهم الحقيقية. إليك السبب — والخريطة للخروج منها.
  2. الجزء 02تقسيم النصوص — القرار الذي يحدد حدودك الأعلىلا يمكنك استرجاع ما قسمته بشكل سيء. تقسيم النصوص هو أكثر الأدوات التي لا تحظى بالتقدير في RAG — والأرخص لتطبيقها بشكل صحيح.
  3. الجزء 03التضمينات وقواعد البيانات الموجهة 101التضمين يحول المعنى إلى هندسة. قاعدة البيانات الموجهة تجعل تلك الهندسة قابلة للبحث في أجزاء من الثانية. احصل على كليهما بشكل صحيح وتصبح الاسترجاعية سهلة.
  4. الجزء 04الاسترجاع الهجين — الكلمات الرئيسية + المتجهاتالبحث المتجهي يفهم المعنى لكن يتعثر على المصطلحات الدقيقة والمعرّفات والكلمات النادرة. البحث بالكلمات الرئيسية يحققها ويفتقد إعادة الصياغة. استخدم كليهما.
  5. الجزء 05إعادة الترتيب — الفوز السريع بالجودةالاسترجاع يحضر لك 30 مقطعاً معقولاً. معيد الترتيب يقرأها مقابل السؤال الفعلي ويرفع الأجزاء الملائمة حقاً إلى الأعلى.
  6. الجزء 06توجيه المولّد — التأسيس والاستشهاداتالاسترجاع الممتاز يضيع إن تجاهله النموذج أو لم يستطع الإشارة إلى مصادره. التأسيس هو انضباط في تصميم المحفزات، وليس إضافة لاحقة.
  7. الجزء 07التقييم — لا يمكنك تحسين ما لا تقيسهبدون مجموعة تقييم، كل تغيير في RAG مجرد انطباع. مع واحدة، تضبط التقسيم والاسترجاع والإشارات برقم يخبرك إن كنت ساعدت أم أضررت.
  8. الجزء 08التعامل مع الهلوسات والضمانات الأمنيةأنت هناعندما لا يجد الاسترجاع شيئاً، ينسج النموذج الذكي إجابات من العدم. الضمانات الأمنية تحول "الخطأ الواثق" إلى "عدم التأكد الصادق" — الفرق الذي يثق به المستخدمون فعلاً.
  9. الجزء 09الانضباط في التكلفة والزمن الكامناستعلام RAG يلمس التضمينات وقاعدة بيانات المتجهات وإعادة الترتيب ونموذج اللغة. كل واحد يضيف الميلي ثواني والسنتات. في النطاق الكبير، الانضباط هنا هو الفرق بين الهامش والكارثة.
  10. الجزء 10معمارية مرجعية الـ RAG للإنتاجكل عنصر في مكانه: الاستيعاب، الاسترجاع الهجين، إعادة الترتيب، التوليد المدعوم بالمصادر، الضمانات، التقييم والتخزين المؤقت — الخطة التي يمكنك نشرها.

تابع التعلّم

الدورة

دورة Claude Mastery

12 وحدة · 5 لغات · شهادة · تجربة 3 أيام مجاناً.

الخطط ←
LinkedInX / TwitterBlueskyThreads