ذكاء اصطناعي

كان الـ LLM يهذي: كيف أنقذنا ‘الجيل المعزز بالاسترجاع’ (RAG) من جحيم الهلوسات؟

أبو عمر 29 مايو، 2026 2 دقائق قراءة

أذكر ذلك اليوم جيداً، كان يوماً مشمساً في مكتبي، وكنت أحتسي فنجان قهوتي الصباحي وأنا أراقب أداء “سالم”، مساعدنا الذكي الجديد الذي بنيناه لأحد العملاء في قطاع التجارة الإلكترونية. سالم، المبني على أحدث نماذج اللغة الكبيرة (LLM)، كان من المفترض أن يكون ثورة في خدمة العملاء. في الأيام الأولى، كان أداؤه مبهراً، يجيب على استفسارات العملاء بسرعة ودقة… أو هكذا ظننا.

رن هاتفي فجأة، وكان على الطرف الآخر مدير المشروع من طرف العميل، وصوته لا يبشر بالخير أبداً. قال لي بلهجة حادة: “أبو عمر، شو هاد اللي بصير؟ المساعد تبعكم بخرف قاعد!”. سألته بهدوء مصطنع: “خير ان شاء الله، شو القصة؟”. أجابني: “القصة إنه سالم قاعد بحكي للزبائن إنه في خصم 90% على كل المنتجات بمناسبة عيد ميلاده! وعم بخترع سياسات إرجاع من وحي خياله! خربتلنا الدنيا يا زلمة!”.

شعرت بالدم يغلي في عروقي. لقد وقعنا في الفخ الذي يخشاه كل مطور ذكاء اصطناعي: “الهلوسة”. نموذجنا اللغوي، الذي دربناه على كم هائل من البيانات، قرر أن يكون “مبدعاً” في أسوأ وقت ممكن. كانت تلك اللحظة بمثابة صفعة أيقظتنا على حقيقة أن قوة الـ LLM وحدها لا تكفي، بل قد تكون كارثية إذا لم نلجمها. ومن رحم هذه الأزمة، ولد الحل: الجيل المعزز بالاسترجاع (RAG).

ما هي مشكلة “الهلوسة” في نماذج اللغة الكبيرة (LLMs)؟

قبل أن نغوص في الحل، دعونا نفهم المشكلة جيداً. “الهلوسة” (Hallucination) في سياق نماذج اللغة الكبيرة لا تعني أن النموذج يرى أشياء غير موجودة، بل هي مصطلح يصف ميل هذه النماذج لتوليد معلومات تبدو منطقية ومقنعة لكنها غير صحيحة أو لا تستند إلى أي حقيقة في البيانات التي تدربت عليها.

تخيل الـ LLM كطالب ذكي جداً قرأ كل كتب المكتبة، لكنه يجيب في الامتحان من ذاكرته فقط. إذا لم يكن يعرف الإجابة الدقيقة، فإنه لن يقول “لا أعرف”، بل سيحاول تأليف إجابة تبدو الأكثر احتمالاً ومنطقية بناءً على كل ما قرأه. هو ليس كاذباً بطبيعته، بل هو “مُكمّل أنماط” (Pattern Completer) من الطراز الرفيع. هذه “الثقة العمياء” هي التي تجعل الهلوسات خطيرة جداً في التطبيقات العملية.

الحل المنقذ: الجيل المعزز بالاسترجاع (RAG)

بعد كارثة “سالم”، جلسنا كفريق نبحث عن حل. لا يمكننا إعادة تدريب النموذج بالكامل في كل مرة يضيف فيها العميل منتجاً جديداً أو يغير سياسة الإرجاع. الحل يجب أن يكون ديناميكياً وفعالاً. وهنا، ظهرت تقنية RAG كضوء في نهاية النفق.

ببساطة، شو هو الـ RAG؟

الجيل المعزز بالاسترجاع (Retrieval-Augmented Generation) هو إطار عمل أو معمارية برمجية تدمج بين قوة نماذج اللغة الكبيرة في الفهم والتوليد، وقوة محركات البحث التقليدية في استرجاع المعلومات الدقيقة.

الفكرة بسيطة بشكل عبقري: بدلاً من أن نسأل الـ LLM سؤالاً ويجيب من ذاكرته العامة الواسعة (وغير الموثوقة دائماً)، نقوم بالآتي:

الاسترجاع (Retrieval): عندما يسأل المستخدم سؤالاً، نبحث أولاً في قاعدة بياناتنا الخاصة والموثوقة (مثل ملفات PDF، صفحات موقع، وثائق داخلية) عن المعلومات ذات الصلة بالسؤال.
التعزيز (Augmentation): نأخذ هذه المعلومات الدقيقة التي وجدناها ونضيفها إلى سؤال المستخدم الأصلي كسياق.
التوليد (Generation): نقدم هذا “الطلب المعزز” (Augmented Prompt) إلى الـ LLM ونطلب منه الإجابة على السؤال بالاعتماد حصراً على السياق الذي قدمناه له.

بهذه الطريقة، نحن نحول الـ LLM من طالب في امتحان “مغلق الكتاب” إلى طالب في امتحان “مفتوح الكتاب”، حيث الكتاب هو بياناتنا الموثوقة. هذا يحد بشكل كبير من الهلوسات ويجعل الإجابات مستندة إلى حقائق يمكن التحقق منها.

كيف يعمل الـ RAG خطوة بخطوة؟ (الآلية من الداخل)

دعونا نفصّل العملية التقنية أكثر لتصبح الصورة أوضح:

مرحلة التجهيز (Indexing/Ingestion):
- تقطيع البيانات (Chunking): نقوم بأخذ مصادر المعرفة الخاصة بنا (مثلاً، ملف PDF يحتوي على سياسات الشركة) ونقسمها إلى أجزاء صغيرة (Chunks) من النص.
- التضمين (Embedding): نستخدم نموذج تضمين (Embedding Model) لتحويل كل جزء نصي إلى تمثيل رقمي (Vector) يسمى “تضمين”. هذا المتجه الرقمي يلتقط المعنى الدلالي للنص.
- التخزين (Storing): نقوم بتخزين هذه المتجهات النصية في قاعدة بيانات متخصصة تسمى “قاعدة بيانات المتجهات” (Vector Database) مثل Pinecone, ChromaDB, أو FAISS.
مرحلة الاستعلام (Querying):
- تضمين السؤال: عندما يطرح المستخدم سؤالاً، نقوم بتحويل نصه إلى متجه رقمي باستخدام نفس نموذج التضمين.
- بحث التشابه (Similarity Search): نستخدم متجه السؤال للبحث في قاعدة بيانات المتجهات عن المتجهات (أي الأجزاء النصية) الأكثر تشابهاً معه دلالياً.
- بناء السياق: الأجزاء النصية التي تم استرجاعها تشكل الآن “السياق” (Context).
- توليد الإجابة: ننشئ طلباً (Prompt) للـ LLM بالصيغة التالية: "السياق: [النصوص المسترجعة]. السؤال: [سؤال المستخدم]. أجب على السؤال بناءً على السياق أعلاه فقط.".

النتيجة؟ إجابة دقيقة، مستندة إلى بياناتك، مع ذكر المصدر أحياناً إن أردت.

ورشة عمل أبو عمر: بناء نظام RAG بسيط

كلام نظري جميل، لكن “الحكي ما بطعمي خبز”! دعونا نرى كيف يمكننا بناء نظام RAG بسيط باستخدام لغة بايثون والمكتبات الشائعة مثل LangChain.

الأدوات اللي بنحتاجها

سنحتاج إلى بعض المكتبات لتسهيل العمل. يمكنك تثبيتها باستخدام pip:

pip install langchain openai chromadb pypdf

langchain: إطار عمل يسهل بناء تطبيقات الـ LLM.
openai: للوصول إلى نماذج OpenAI (يمكن استبدالها بأي مزود آخر).
chromadb: قاعدة بيانات متجهات بسيطة تعمل محلياً.
pypdf: لقراءة ملفات PDF.

الكود يا مبرمج!

لنفترض أن لدينا ملفاً اسمه policy.pdf يحتوي على سياسة الإرجاع الخاصة بشركتنا. نريد بناء نظام يجيب على أسئلة العملاء حول هذه السياسة.


import os
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.chat_models import ChatOpenAI
from langchain.chains import RetrievalQA

# تأكد من وضع مفتاح OpenAI API الخاص بك كمتغير بيئة
# os.environ["OPENAI_API_KEY"] = "sk-..."

# 1. تحميل وتقطيع المستند
loader = PyPDFLoader("policy.pdf")
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_documents(documents)

# 2. إنشاء التضمينات وتخزينها في قاعدة بيانات المتجهات
embeddings = OpenAIEmbeddings()
vector_store = Chroma.from_documents(texts, embeddings)

# 3. إعداد سلسلة RAG
# retriever هو الجزء المسؤول عن البحث في قاعدة البيانات
retriever = vector_store.as_retriever()
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# RetrievalQA هي سلسلة جاهزة في LangChain لتنفيذ RAG
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff", # "stuff" تعني وضع كل النصوص المسترجعة في السياق
    retriever=retriever
)

# 4. طرح سؤال
question = "ما هي مدة فترة الإرجاع للمنتجات؟"
response = qa_chain.run(question)

print(f"السؤال: {question}")
print(f"الإجابة: {response}")

نصيحة من الخبير: جودة البيانات المدخلة هي مفتاح نجاح نظام RAG. “Garbage in, garbage out” (قمامة تدخل، قمامة تخرج). قبل أن تلقي بكل مستنداتك في النظام، قم بتنظيفها وتنظيمها. كلما كانت مصادر المعرفة الخاصة بك أكثر دقة وتنظيماً، كانت إجابات نظامك أفضل. فكر في جودة “الاسترجاع” (R) قبل أن تفكر في جودة “التوليد” (G).

ما بعد الأساسيات: تطوير نظام الـ RAG

النظام البسيط الذي بنيناه رائع كنقطة بداية، لكن في العالم الحقيقي، ستحتاج إلى تحسينات إضافية:

استراتيجيات التقطيع (Chunking): حجم الأجزاء (Chunk size) والتداخل بينها (Overlap) يؤثر بشكل كبير على جودة الاسترجاع. جرب أحجاماً مختلفة لتجد الأفضل لبياناتك.
إعادة الترتيب (Re-ranking): أحياناً، البحث عن التشابه قد يعيد نتائج ليست هي الأكثر صلة. يمكنك إضافة خطوة “إعادة ترتيب” (Re-ranker) تستخدم نموذجاً أكثر تعقيداً لترتيب أفضل 10-20 نتيجة تم استرجاعها واختيار أفضل 3-5 منها لتقديمها للـ LLM.
البحث الهجين (Hybrid Search): لا تتجاهل قوة البحث التقليدي بالكلمات المفتاحية (Keyword Search). دمج البحث الدلالي (Vector Search) مع البحث بالكلمات المفتاحية يمكن أن يعطي نتائج مذهلة، خاصة للمصطلحات التقنية أو أسماء المنتجات المحددة.

الخلاصة: الـ RAG ليس عصا سحرية، بل أداة قوية

في النهاية، ما تعلمناه من أزمة “سالم” هو أن نماذج اللغة الكبيرة أدوات جبارة، لكنها كالمارد الذي خرج من القمقم، تحتاج إلى توجيه وإرشاد. تقنية RAG هي تلك الإرشادات. هي الجسر الذي يربط بين عالم الـ LLM الإبداعي واللامحدود، وعالم بياناتنا الواقعي والمحدد.

إنها لا تقضي على الهلوسات بنسبة 100%، لكنها تقلل منها بشكل جذري وتحول تطبيقات الذكاء الاصطناعي من “صناديق سوداء” مخيفة إلى مساعدين شفافين وموثوقين. بالنسبة لنا، لقد أنقذت RAG مشروعنا وسمعتنا، والأهم من ذلك، علمتنا درساً قيماً في بناء أنظمة ذكاء اصطناعي مسؤولة.

لذا، في المرة القادمة التي تفكر فيها في بناء تطبيق يعتمد على LLM، لا تسلمه المفاتيح وتأمل الأفضل. أعطه كتاباً مفتوحاً ودقيقاً ليقرأ منه. ما تخاف من الهلوسات، افهمها وتحكم فيها. الـ RAG هو بوصلتك في هذا العالم الجديد، فاستخدمه بحكمة لتبني تطبيقات موثوقة وقوية. يلا، شدوا الهمة! 💪

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

ذكاء اصطناعي

موظفوك يسرّبون أسرار شركتك إلى ChatGPT.. وأنت آخر من يعلم!

هل تعلم أن مساعد الذكاء الاصطناعي الذي يعزز إنتاجية فريقك قد يكون أكبر ثغرة أمنية في شركتك؟ دراسة حديثة تكشف أرقاماً صادمة عن تسريب بيانات...

7 فبراير، 2026 قراءة المزيد

ذكاء اصطناعي

كان بحثنا أعمى عن المعنى: كيف أنقذت قواعد بيانات المتجهات (Vector Databases) أنظمتنا من جحيم البحث الحرفي؟

أشارككم قصة من قلب المعاناة مع أنظمة البحث التقليدية، وكيف كانت قواعد بيانات المتجهات (Vector Databases) والبحث الدلالي هي طوق النجاة. هذه المقالة ليست مجرد...

4 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

قرارات الذكاء الاصطناعي كانت صندوقًا أسود: كيف أنقذنا ‘الذكاء الاصطناعي القابل للتفسير’ (XAI) من جحيم انعدام الثقة؟

أنا أبو عمر، مطور برمجيات فلسطيني، وأشارككم اليوم قصة واقعية عن نموذج ذكاء اصطناعي كاد أن يفشل بسبب غموضه. سنتعمق في مفهوم "الصندوق الأسود" وكيف...

17 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

كيف أنقذنا نماذجنا اللغوية من هلوساتها باستخدام RAG: قصة من الخنادق البرمجية

كانت نماذجنا اللغوية تهلوس وتُعطي معلومات خاطئة، مما كاد أن يدمر مشروعنا. في هذه المقالة، أشارككم قصة حقيقية وكيف كانت تقنية "التوليد المعزز بالاسترجاع" (RAG)...

5 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

نموذجنا كان يتحدث بلهجة روبوتية: كيف أنقذنا ‘الضبط الدقيق’ (Fine-tuning) من جحيم الإجابات العامة؟

أشارككم قصة من قلب الميدان، يوم كان نموذجنا الذكي يتحدث كأنه موظف بنك آلي. سأروي لكم كيف حوّلنا هذا الروبوت البارد إلى مساعد ذكي يفهم...

8 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

كانت توصياتنا ضربة حظ: كيف أنقذنا ‘الترشيح التشاركي’ من جحيم الضياع؟

أشارككم قصة من الميدان، كيف انتقلنا من توصيات عشوائية للمستخدمين إلى نظام ذكي يعتمد على الترشيح التشاركي (Collaborative Filtering). مقالة عملية تشرح المفهوم، أنواعه، مع...

25 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

كان بحثنا غبياً: كيف أنقذتنا ‘قواعد بيانات المتجهات’ من جحيم البحث بالكلمات المفتاحية؟

أشارككم قصة حقيقية عن مشروع كاد أن يفشل بسبب محدودية البحث التقليدي، وكيف كانت قواعد بيانات المتجهات (Vector Databases) والبحث الدلالي هي طوق النجاة. مقالة...

15 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

نماذجنا كانت تهلوس: كيف أنقذنا ‘الاسترجاع المعزز للتوليد’ (RAG) من جحيم الأجوبة الخاطئة؟

كنت على وشك أن أفقد أحد أهم عملائي بسبب "هلوسة" نموذج الذكاء الاصطناعي الذي بنيناه، حيث كان يختلق إجابات بثقة مذهلة. في هذه المقالة، أسرد...

9 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

من الصندوق الأسود إلى الوضوح: كيف أنقذتنا أدوات SHAP و LIME من جحيم حيرة نماذج الذكاء الاصطناعي

في عالم الذكاء الاصطناعي، غالبًا ما تكون نماذجنا كالصناديق السوداء الغامضة. في هذه المقالة، أشارككم قصة حقيقية عن حيرتنا أمام قرارات نموذج غامض، وكيف أخرجتنا...

1 مايو، 2026 قراءة المزيد

آخر المدونات

برمجة وقواعد بيانات

تحديثات قاعدة البيانات بدون توقف: كيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من جحيم التوقفات المجدولة؟

هل سئمت من إيقاف الخدمة مع كل تحديث لهيكلة قاعدة البيانات؟ أشارككم قصة حقيقية وكيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من ليالي النشر الطويلة والمُجهدة،...

4 يونيو، 2026 قراءة المزيد

الشبكات والـ APIs

كانت إعادة المحاولة كارثة: كيف أنقذتنا مفاتيح عدم تكرار العمليات (Idempotency Keys) من جحيم الفواتير المزدوجة؟

أشارككم قصة حقيقية من الخنادق البرمجية، يوم كاد خطأ بسيط في إعادة محاولة طلبات الدفع أن يكلفنا سمعتنا وأموال عملائنا. اكتشفوا معنا كيف كانت مفاتيح...

4 يونيو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

كانت مهمتي البرمجية للاختبار مجرد كود: كيف أنقذني توثيق القرارات من جحيم الصمت بعد المقابلة؟

أشارككم قصة حقيقية من بداياتي، وكيف تعلمت بالطريقة الصعبة أن المهمة البرمجية ليست مجرد كتابة كود، بل هي فرصة لإظهار طريقة تفكيرك. اكتشف كيف يمكن...

4 يونيو، 2026 قراءة المزيد

التوسع والأداء العالي والأحمال

نمط قاطع الدائرة: كيف نجا نظامنا من جحيم الانهيارات المتسلسلة؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف تحول فشل بسيط في إحدى الخدمات إلى انهيار كارثي للنظام بأكمله. واكتشفوا معنا نمط "قاطع الدائرة" (Circuit...

4 يونيو، 2026 قراءة المزيد