إتقان هندسة RAG2 / 10
تقسيم النصوص — القرار الذي يحدد حدودك الأعلى
لا يمكنك استرجاع ما قسمته بشكل سيء. تقسيم النصوص هو أكثر الأدوات التي لا تحظى بالتقدير في RAG — والأرخص لتطبيقها بشكل صحيح.

الاسترجاع يمكنه فقط أن يعيد الأجزاء التي أنشأتها. إذا قسمت فكرة إلى نصين، فلن يسترجعها أي نموذج embedding على وجه الأرض كاملة. تقسيم النصوص يحدد السقف لكل شيء بعده.
ثلاث استراتيجيات
- تقسيم ثابت — تقسيم كل N token مع تداخل. بسيط وسريع وغبي. مناسب للنثر الموحد، سيء للمستندات المنظمة.
- بنيوي — التقسيم على حدود المستند الخاصة به: العناوين والأقسام وعناصر القوائم وكتل الأكواد. يحترم المعنى مجاناً.
- دلالي — التقسيم حيث ينتقل الموضوع (بناءً على مسافة embedding). أفضل جودة، تكلفة أعلى.
ابدأ بالتقسيم البنيوي؛ فهو يلتقط معظم الفائدة بتكلفة قريبة من الصفر.
الحجم والتداخل
إذا كان الجزء صغيراً جداً فسيفقد السياق؛ وإذا كان كبيراً جداً فسيصبح الاسترجاع مشوشاً والمطالبة مكلفة. قيمة افتراضية عملية: 300–600 token مع ~15% تداخل، ثم اضبط مقابل مجموعة التقييم الخاصة بك (المقالة 7).
البيانات الوصفية هي القوة الخفية
أرفق بيانات وصفية بكل جزء: المصدر والعنوان والقسم والتاريخ وURL. فهي تشغّل الاسترجاع المصفى (هذا المنتج فقط، المستندات بعد هذا التاريخ فقط) وتسمح للمولّد بالاستشهاد بدقة.
الخطوة التالية: تحويل هذه الأجزاء إلى متجهات، وأين تخزنها.
السلسلة — إتقان هندسة RAG
- الجزء 01لماذا يفشل نظام RAG البسيط في الإنتاجعرض البحث المتجه بـ 50 سطر الذي يبهر في دفتر الملاحظات ينهار في اللحظة التي يطرح فيها المستخدمون الحقيقيون أسئلتهم الحقيقية. إليك السبب — والخريطة للخروج منها.
- الجزء 02تقسيم النصوص — القرار الذي يحدد حدودك الأعلى — أنت هنالا يمكنك استرجاع ما قسمته بشكل سيء. تقسيم النصوص هو أكثر الأدوات التي لا تحظى بالتقدير في RAG — والأرخص لتطبيقها بشكل صحيح.
- الجزء 03التضمينات وقواعد البيانات الموجهة 101التضمين يحول المعنى إلى هندسة. قاعدة البيانات الموجهة تجعل تلك الهندسة قابلة للبحث في أجزاء من الثانية. احصل على كليهما بشكل صحيح وتصبح الاسترجاعية سهلة.
- الجزء 04الاسترجاع الهجين — الكلمات الرئيسية + المتجهاتالبحث المتجهي يفهم المعنى لكن يتعثر على المصطلحات الدقيقة والمعرّفات والكلمات النادرة. البحث بالكلمات الرئيسية يحققها ويفتقد إعادة الصياغة. استخدم كليهما.
- الجزء 05إعادة الترتيب — الفوز السريع بالجودةالاسترجاع يحضر لك 30 مقطعاً معقولاً. معيد الترتيب يقرأها مقابل السؤال الفعلي ويرفع الأجزاء الملائمة حقاً إلى الأعلى.
- الجزء 06توجيه المولّد — التأسيس والاستشهاداتالاسترجاع الممتاز يضيع إن تجاهله النموذج أو لم يستطع الإشارة إلى مصادره. التأسيس هو انضباط في تصميم المحفزات، وليس إضافة لاحقة.
- الجزء 07التقييم — لا يمكنك تحسين ما لا تقيسهبدون مجموعة تقييم، كل تغيير في RAG مجرد انطباع. مع واحدة، تضبط التقسيم والاسترجاع والإشارات برقم يخبرك إن كنت ساعدت أم أضررت.
- الجزء 08التعامل مع الهلوسات والضمانات الأمنيةعندما لا يجد الاسترجاع شيئاً، ينسج النموذج الذكي إجابات من العدم. الضمانات الأمنية تحول "الخطأ الواثق" إلى "عدم التأكد الصادق" — الفرق الذي يثق به المستخدمون فعلاً.
- الجزء 09الانضباط في التكلفة والزمن الكامناستعلام RAG يلمس التضمينات وقاعدة بيانات المتجهات وإعادة الترتيب ونموذج اللغة. كل واحد يضيف الميلي ثواني والسنتات. في النطاق الكبير، الانضباط هنا هو الفرق بين الهامش والكارثة.
- الجزء 10معمارية مرجعية الـ RAG للإنتاجكل عنصر في مكانه: الاستيعاب، الاسترجاع الهجين، إعادة الترتيب، التوليد المدعوم بالمصادر، الضمانات، التقييم والتخزين المؤقت — الخطة التي يمكنك نشرها.