Skip to content

إتقان هندسة RAG9 / 10

الانضباط في التكلفة والزمن الكامن

استعلام RAG يلمس التضمينات وقاعدة بيانات المتجهات وإعادة الترتيب ونموذج اللغة. كل واحد يضيف الميلي ثواني والسنتات. في النطاق الكبير، الانضباط هنا هو الفرق بين الهامش والكارثة.

الانضباط في التكلفة والزمن الكامن

كل استعلام RAG هو سلسلة توريد صغيرة: تضمين السؤال، البحث، إعادة الترتيب، التوليد. اضربها في حجم الحركة والخيارات العابرة تصبح خيارات مكلفة. التكلفة والزمن الكامن هما انضباط هندسي وليس فكرة متأخرة.

اعرف أين تذهب

  • التوليد يهيمن على التكلفة — يتسع مع حجم السياق. أقل قطع أفضل (إعادة ترتيب) هو انتصار في التكلفة وليس جودة فقط.
  • إعادة الترتيب تتسع مع اتساع نطاق البحث. حجم الشبكة بشكل صحيح.
  • التضمينات رخيصة لكل استعلام لكنها تتراكم في إعادة التضمين والبيانات المدخلة.

خزن مؤقت بقوة

  • خزن التضمينات المؤقت — الاستعلامات المتطابقة لا يجب أن تعيد التضمين.
  • خزن الاسترجاع المؤقت — الأسئلة الشهيرة تصل لنفس القطع؛ خزن نتيجة الاسترجاع مؤقتاً.
  • خزن الإجابة المؤقت — للأسئلة المستقرة والشائعة، خزن الإجابة النهائية مع مدة صلاحية معقولة.

إصابة الخزن المؤقت تحول خط أنابيب متعدد الخطوات إلى بحث بسيط.

حجم كل خطوة بشكل صحيح

استخدم نموذج صغير سريع للخطوات الرخيصة (إعادة كتابة الاستعلام، فحص الأمانة) واحتفظ بالنموذج القوي للإجابة النهائية. ليست كل خطوة تحتاج أفضل نموذج لديك.

استرجاع حاد، توليد مرتكز على الأساس، حراس، ونموذج تكلفة. الخاتمة تجمعهم في معمارية مرجعية.

شارك هذا المقال

#RAG #LLM #AI

LinkedInX / TwitterBlueskyThreadsRedditHacker NewsWhatsAppبريد إلكتروني

السلسلة — إتقان هندسة RAG

  1. الجزء 01لماذا يفشل نظام RAG البسيط في الإنتاجعرض البحث المتجه بـ 50 سطر الذي يبهر في دفتر الملاحظات ينهار في اللحظة التي يطرح فيها المستخدمون الحقيقيون أسئلتهم الحقيقية. إليك السبب — والخريطة للخروج منها.
  2. الجزء 02تقسيم النصوص — القرار الذي يحدد حدودك الأعلىلا يمكنك استرجاع ما قسمته بشكل سيء. تقسيم النصوص هو أكثر الأدوات التي لا تحظى بالتقدير في RAG — والأرخص لتطبيقها بشكل صحيح.
  3. الجزء 03التضمينات وقواعد البيانات الموجهة 101التضمين يحول المعنى إلى هندسة. قاعدة البيانات الموجهة تجعل تلك الهندسة قابلة للبحث في أجزاء من الثانية. احصل على كليهما بشكل صحيح وتصبح الاسترجاعية سهلة.
  4. الجزء 04الاسترجاع الهجين — الكلمات الرئيسية + المتجهاتالبحث المتجهي يفهم المعنى لكن يتعثر على المصطلحات الدقيقة والمعرّفات والكلمات النادرة. البحث بالكلمات الرئيسية يحققها ويفتقد إعادة الصياغة. استخدم كليهما.
  5. الجزء 05إعادة الترتيب — الفوز السريع بالجودةالاسترجاع يحضر لك 30 مقطعاً معقولاً. معيد الترتيب يقرأها مقابل السؤال الفعلي ويرفع الأجزاء الملائمة حقاً إلى الأعلى.
  6. الجزء 06توجيه المولّد — التأسيس والاستشهاداتالاسترجاع الممتاز يضيع إن تجاهله النموذج أو لم يستطع الإشارة إلى مصادره. التأسيس هو انضباط في تصميم المحفزات، وليس إضافة لاحقة.
  7. الجزء 07التقييم — لا يمكنك تحسين ما لا تقيسهبدون مجموعة تقييم، كل تغيير في RAG مجرد انطباع. مع واحدة، تضبط التقسيم والاسترجاع والإشارات برقم يخبرك إن كنت ساعدت أم أضررت.
  8. الجزء 08التعامل مع الهلوسات والضمانات الأمنيةعندما لا يجد الاسترجاع شيئاً، ينسج النموذج الذكي إجابات من العدم. الضمانات الأمنية تحول "الخطأ الواثق" إلى "عدم التأكد الصادق" — الفرق الذي يثق به المستخدمون فعلاً.
  9. الجزء 09الانضباط في التكلفة والزمن الكامنأنت هنااستعلام RAG يلمس التضمينات وقاعدة بيانات المتجهات وإعادة الترتيب ونموذج اللغة. كل واحد يضيف الميلي ثواني والسنتات. في النطاق الكبير، الانضباط هنا هو الفرق بين الهامش والكارثة.
  10. الجزء 10معمارية مرجعية الـ RAG للإنتاجكل عنصر في مكانه: الاستيعاب، الاسترجاع الهجين، إعادة الترتيب، التوليد المدعوم بالمصادر، الضمانات، التقييم والتخزين المؤقت — الخطة التي يمكنك نشرها.

تابع التعلّم

الدورة

دورة Claude Mastery

12 وحدة · 5 لغات · شهادة · تجربة 3 أيام مجاناً.

الخطط ←
LinkedInX / TwitterBlueskyThreads