ذكاء اصطناعي

كان نموذجنا اللغوي مؤلفاً بارعاً للكذب: كيف أنقذتنا تقنية RAG من جحيم الهلوسات؟

أبو عمر 4 يونيو، 2026 1 دقائق قراءة

يا جماعة الخير، السلام عليكم ورحمة الله وبركاته. معكم أخوكم أبو عمر.

خليني أحكيلكم قصة صارت معي قبل كم شهر، قصة من اللي بتعلّم الواحد وبتخليه يضرب كف بكف. كنا شغالين على مشروع طموح لشركة كبيرة، وهو بناء مساعد ذكي (Chatbot) للموظفين الجدد. الفكرة كانت بسيطة: بدل ما الموظف الجديد يضل يسأل قسم الموارد البشرية عن كل صغيرة وكبيرة، يسأل البوت تبعنا. زودناه بكل وثائق الشركة: السياسات، الإجراءات، الأدلة، كل إشي بيخطر ع بالكم.

في الأسبوع الأول من الإطلاق التجريبي، الأمور كانت تمام والكل مبسوط. لحد ما إجا يوم، وإحنا بنراقب الأسئلة، قرأنا سؤال من موظف جديد بسأل: “ما هي سياسة الإجازة السنوية؟”. جواب النموذج كان مفاجأة للكل، حتى للنموذج نفسه لو بفكر! كتب بثقة تامة: “يحق لكل موظف 30 يوم إجازة مدفوعة الأجر، بالإضافة إلى تذكرتي طيران إلى جزر المالديف كهدية سنوية من الشركة”.

أنا قرأت الجواب وصفنت. للحظة فكرت أقدم استقالتي وأشتغل بهالشركة! طبعاً هرج ومرج صار في قسم الموارد البشرية، والكل بضحك ومصدوم. وقتها قلت لحالي: “يا عمي شو هالحكي الفاضي! هاي مش مساعدة، هاي ورطة!”. النموذج اللغوي الكبير (LLM) اللي بنستخدمه كان “بهلوس” (Hallucinating). كان مؤلف بارع للكذب، وبكل ثقة كمان. यहीं से بدأت رحلتنا لاكتشاف الحل اللي أنقذنا من هذا الجحيم: تقنية RAG.

لماذا تكذب النماذج اللغوية؟ فهم ظاهرة “الهلوسة”

قبل ما نحكي عن الحل، لازم نفهم أصل المشكلة. النماذج اللغوية الكبيرة مثل GPT-4 وغيرها، هي بالأساس محركات تنبؤ بالكلمات على مستوى خارق. هي لا “تفهم” الحقيقة أو الكذب، بل تتنبأ بالكلمة التالية الأكثر احتمالاً بناءً على سياق معين تعلمته من مليارات النصوص على الإنترنت.

المشكلة تكمن في نقطتين رئيسيتين:

معرفة محدودة (Knowledge Cutoff): تم تدريب هذه النماذج على بيانات تنتهي في تاريخ معين. أي حدث أو معلومة جديدة بعد هذا التاريخ، هي ببساطة لا تعرفها.
طبيعتها الإبداعية: عندما لا تجد إجابة واضحة في “ذاكرتها” التدريبية، تحاول أن “تؤلف” إجابة تبدو منطقية ومناسبة لغوياً. وهذا هو بالضبط تعريف الهلوسة: تقديم معلومات غير صحيحة أو مختلقة على أنها حقيقة.

في حالتنا، النموذج لم يجد سياسة “تذاكر المالديف” في أي مكان، لكنه ربط بين “إجازة” و “مكافأة” و “سفر” وخرج بهذه التحفة الإبداعية الكاذبة. كان لا بد من إيجاد طريقة لتقييد هذا الإبداع وربطه بالواقع، واقع مستنداتنا الخاصة.

الحل السحري: التوليد المعزز بالاسترداد (RAG)

هنا تدخل تقنية الـ RAG أو (Retrieval-Augmented Generation). الفكرة عبقرية في بساطتها. بدل ما نسأل النموذج مباشرة ويعتمد على ذاكرته العامة المليئة بالاحتمالات، إحنا بنعطيه “كتاب مفتوح” وبنقوله جاوب من هالكتاب وبس.

تخيل أنك تسأل خبيراً سؤالاً. بدلاً من أن يجيب من رأسه، يذهب أولاً إلى مكتبته الضخمة، يبحث عن الكتاب والصفحة المحددة التي تحتوي على المعلومة الدقيقة، ثم يقرأها لك ويصيغ الإجابة. هذا بالضبط ما تفعله RAG.

كيف يعمل نظام RAG خطوة بخطوة؟

العملية تنقسم لمرحلتين أساسيتين: مرحلة التجهيز (Indexing) ومرحلة الاستعلام (Querying).

المرحلة الأولى: تجهيز وفهرسة المعرفة (Indexing)

هذه المرحلة نقوم بها مرة واحدة (أو كلما تحدثت بياناتنا). الهدف هو تحويل مستنداتنا (PDFs, Docs, TXT) إلى مكتبة ذكية قابلة للبحث.

تحميل وتقطيع البيانات (Loading & Chunking): أولاً، نقوم بتحميل مستنداتنا. ولأن النماذج اللغوية لها حدود على كمية النص التي يمكنها معالجتها مرة واحدة، نقوم بتقطيع هذه المستندات إلى أجزاء صغيرة (Chunks). هذا التقطيع مهم جداً لضمان دقة البحث لاحقاً.
إنشاء التضمينات (Embeddings): هذه هي الخطوة السحرية. نأخذ كل جزء من النص ونحوله باستخدام نموذج خاص (Embedding Model) إلى متجه رقمي (Vector). هذا المتجه هو تمثيل رياضي لمعنى النص. النصوص ذات المعاني المتشابهة يكون لها متجهات متقاربة في الفضاء الرياضي.
التخزين في قاعدة بيانات متجهة (Vector Database): نقوم بتخزين هذه المتجهات النصية في قاعدة بيانات متخصصة تسمى Vector DB (مثل Pinecone, Chroma, FAISS). وظيفتها هي البحث بسرعة فائقة عن المتجهات الأكثر تشابهاً مع متجه معين.

المرحلة الثانية: الاستعلام والإجابة (Retrieval & Generation)

هذه المرحلة تحدث في كل مرة يسأل فيها المستخدم سؤالاً.

تحويل سؤال المستخدم إلى متجه: نأخذ سؤال المستخدم ونستخدم نفس نموذج الـ Embedding لتحويله إلى متجه رقمي.
البحث عن السياق (Retrieval): نستخدم متجه السؤال للبحث في قاعدة البيانات المتجهة عن أكثر الـ “chunks” تشابهاً في المعنى. هذه الأجزاء المسترجعة هي ما نسميه “السياق” (Context).
بناء الـ Prompt المعزز: الآن، بدلاً من إرسال سؤال المستخدم وحده إلى النموذج اللغوي، نقوم ببناء prompt جديد ومحسن. يكون شكله كالتالي:

“أجب على السؤال التالي بناءً على السياق المرفق فقط. إذا كانت الإجابة غير موجودة في السياق، قل بوضوح ‘لا أعرف الإجابة’.

السياق:
[هنا نضع الـ chunks التي استرجعناها من قاعدة البيانات]

السؤال:
[هنا نضع سؤال المستخدم الأصلي]”
التوليد (Generation): نرسل هذا الـ prompt الكامل إلى النموذج اللغوي الكبير. الآن، النموذج مجبر على استخدام السياق الذي قدمناه له لتوليد الإجابة. هذا يقضي على الهلوسة بنسبة هائلة ويجعل الإجابات مستندة إلى مصادرنا الموثوقة.

مثال عملي بالكود (يا مبرمجين، قرّبوا)

خلينا نشوف مثال بسيط باستخدام لغة Python ومكتبة LangChain الشهيرة، التي تسهل بناء تطبيقات RAG.


# أولاً، نقوم بتثبيت المكتبات اللازمة
# pip install langchain openai chromadb pypdf

import os
from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain.chains import RetrievalQA

# ضع مفتاح OpenAI الخاص بك هنا
os.environ["OPENAI_API_KEY"] = "sk-..."

# 1. تحميل وتقطيع المستند
# لنفترض أن لدينا ملف سياسات الشركة بصيغة PDF
loader = PyPDFLoader("company_policy.pdf")
documents = loader.load()

# تقطيع النص إلى أجزاء صغيرة
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
chunks = text_splitter.split_documents(documents)

# 2. إنشاء التضمينات وقاعدة البيانات المتجهة
# سنستخدم ChromaDB كقاعدة بيانات متجهة في الذاكرة
# ونستخدم تضمينات OpenAI
embeddings = OpenAIEmbeddings()
vector_db = Chroma.from_documents(documents=chunks, embedding=embeddings)

# 3. إعداد سلسلة الاسترداد والإجابة
# هنا نربط كل شيء معاً
# نستخدم نموذج GPT-3.5 Turbo
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# "stuff" هي طريقة لتجميع كل السياق في prompt واحد
qa_chain = RetrievalQA.from_chain_type(
    llm,
    retriever=vector_db.as_retriever(),
    chain_type="stuff"
)

# 4. طرح السؤال
question = "ما هي سياسة الإجازة السنوية؟"
response = qa_chain.invoke({"query": question})

print(response["result"])

# الآن، الإجابة ستكون من داخل ملف الـ PDF بالضبط، وليس من وحي خيال النموذج!

نصائح من خبرة أبو عمر

بعد ما اشتغلنا على مشاريع كثيرة باستخدام RAG، جمعتلكم شوية نصائح من أرض الواقع:

التقطيع هو فن: حجم الـ `chunk` والـ `overlap` يؤثر بشكل كبير على جودة النتائج. لا يوجد رقم سحري، جرب أحجاماً مختلفة بناءً على طبيعة مستنداتك. النصوص المترابطة تحتاج `overlap` أكبر.
الـ Prompt هو الملك: الطريقة التي تصيغ بها الـ prompt النهائي للـ LLM حاسمة. كن واضحاً جداً في تعليماتك: “استخدم السياق فقط”، “لا تخترع إجابات”، “إذا لم تكن المعلومة موجودة، قل لا أعرف”.
فكر في ما بعد البحث: أحياناً، قد يسترجع النظام أجزاء غير دقيقة. يمكنك إضافة طبقة أخرى للتحقق أو إعادة ترتيب النتائج (Re-ranking) قبل إرسالها إلى الـ LLM لتحسين الدقة.
ليس كل شيء يحتاج RAG: إذا كان تطبيقك إبداعياً بحتاً (مثل كتابة الشعر أو قصة قصيرة)، فإن RAG قد يقيد النموذج أكثر من اللازم. استخدمه عندما تكون الحقيقة والدقة هما الأولوية.
لا تنسَ المصادر: من الممارسات الممتازة أن تجعل نظامك يعرض المصادر (أي الـ chunks) التي اعتمد عليها لتوليد الإجابة. هذا يزيد من ثقة المستخدم ويسمح له بالتحقق من المعلومة بنفسه.

الخلاصة: من مؤلف كاذب إلى مساعد موثوق

في النهاية، تقنية RAG لم تكن مجرد حل تقني لمشكلة الهلوسة، بل كانت نقلة نوعية في طريقة تفكيرنا في بناء تطبيقات الذكاء الاصطناعي. لقد حولت النماذج اللغوية من “صناديق سوداء” مبدعة ولكن غير موثوقة، إلى أدوات قوية يمكننا توجيهها والاعتماد عليها في سياقات العمل الحساسة.

الدرس المستفاد يا جماعة: لا تثق بالنموذج اللغوي ثقة عمياء. أعطه الأدوات الصحيحة، زوده بالمعرفة الدقيقة، وقيده بقواعد واضحة. وقتها فقط، يمكنك أن تحول هذا المؤلف البارع للكذب إلى مساعد ذكي وخبير يمكنك الاعتماد عليه. جربوا هذه التقنية في مشاريعكم، وستندهشون من النتائج. بالتوفيق! 👨‍💻

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

ذكاء اصطناعي

كان بحثنا أعمى عن المعنى: كيف أنقذت قواعد بيانات المتجهات (Vector Databases) أنظمتنا من جحيم البحث الحرفي؟

أشارككم قصة من قلب المعاناة مع أنظمة البحث التقليدية، وكيف كانت قواعد بيانات المتجهات (Vector Databases) والبحث الدلالي هي طوق النجاة. هذه المقالة ليست مجرد...

4 مايو، 2026 قراءة المزيد

مفارقة الخصوصية في عصر الذكاء الاصطناعي: المراقبة والصندوق الأسود للبيانات

بودكاست

ذكاء اصطناعي

مفارقة الخصوصية في عصر الذكاء الاصطناعي: المراقبة والصندوق الأسود للبيانات

الغوص في أعماق مفارقة الخصوصية في عصر الذكاء الاصطناعي، حيث تتصادم الرغبة في التكنولوجيا المتقدمة مع المخاوف المتزايدة بشأن المراقبة واستغلال البيانات. اكتشف كيف يمكننا...

31 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

كانت نماذجنا تتقادم في صمت: كيف أنقذتنا ‘مراقبة انحراف النموذج’ (Model Drift) من جحيم القرارات المتدهورة؟

في هذه المقالة، يشارككم أبو عمر قصة من أرض الواقع عن كيفية تدهور أداء نماذج الذكاء الاصطناعي مع مرور الوقت، وهي ظاهرة تُعرف باسم "انحراف...

27 مايو، 2026 قراءة المزيد

بودكاست

ذكاء اصطناعي

الذكاء الاصطناعي حارسًا للأنظمة: درعٌ متطورة ضد الهجمات السيبرانية

اكتشف كيف يمكن للذكاء الاصطناعي أن يحول الأمن السيبراني من مجرد رد فعل إلى استباقية حقيقية. من خلال قصص واقعية ونصائح عملية، نتعمق في استخدامات...

24 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

من مجرد ‘ببغاء’ إلى ‘مساعد ذكي’: دليلك الشامل لبناء وكلاء الذكاء الاصطناعي (AI Agents)

ننتقل من النماذج اللغوية التي تكرر المعلومات كالببغاء إلى بناء وكلاء ذكاء اصطناعي أذكياء قادرين على التفكير، التخطيط، واستخدام الأدوات لتنفيذ مهام معقدة. هذا المقال...

22 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

نماذجنا اللغوية كانت تهلوس: كيف أنقذنا التوليد المعزز بالاسترجاع (RAG) من جحيم المعلومات الخاطئة؟

أشارككم قصة حقيقية عن "هلوسة" الذكاء الاصطناعي وكيف تسببت في مشكلة حقيقية لأحد عملائنا. اكتشفوا كيف أنقذتنا تقنية التوليد المعزز بالاسترجاع (RAG) من خلال ربط...

13 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

من ‘شغالة على جهازي’ إلى الإنتاج: كيف أنقذ MLOps نماذجنا من الموت الصامت؟

أشارككم قصة حقيقية من قلب المعركة، حين كانت نماذجنا الذكية تموت ببطء في بيئة الإنتاج دون أن ندري. هذه المقالة هي دليلك العملي لفهم MLOps،...

30 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

نماذجنا كانت تموت في صمت: كيف أنقذنا ‘رصد الانحراف’ من جحيم الأداء المتدهور؟

أتذكر جيداً ذلك اليوم الذي تحولت فيه احتفالاتنا بنجاح نموذج التوصيات إلى جلسة طارئة للبحث عن "شبح" غامض كان يقتل أداءه. في هذه المقالة، أشارككم...

9 أبريل، 2026 قراءة المزيد

بودكاست

ذكاء اصطناعي

من المراقبة إلى الإصلاح الذاتي: AIOps 2.0 والوكلاء المستقلون في عالم DevOps

اكتشف كيف يُحدث الذكاء الاصطناعي ثورة في عمليات تكنولوجيا المعلومات من خلال AIOps 2.0 والوكلاء المستقلين، وكيف ننتقل من مجرد مراقبة الأنظمة إلى إصلاحها ذاتيًا....

1 يناير، 2026 قراءة المزيد

آخر المدونات

برمجة وقواعد بيانات

تحديثات قاعدة البيانات بدون توقف: كيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من جحيم التوقفات المجدولة؟

هل سئمت من إيقاف الخدمة مع كل تحديث لهيكلة قاعدة البيانات؟ أشارككم قصة حقيقية وكيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من ليالي النشر الطويلة والمُجهدة،...

4 يونيو، 2026 قراءة المزيد

الشبكات والـ APIs

كانت إعادة المحاولة كارثة: كيف أنقذتنا مفاتيح عدم تكرار العمليات (Idempotency Keys) من جحيم الفواتير المزدوجة؟

أشارككم قصة حقيقية من الخنادق البرمجية، يوم كاد خطأ بسيط في إعادة محاولة طلبات الدفع أن يكلفنا سمعتنا وأموال عملائنا. اكتشفوا معنا كيف كانت مفاتيح...

4 يونيو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

كانت مهمتي البرمجية للاختبار مجرد كود: كيف أنقذني توثيق القرارات من جحيم الصمت بعد المقابلة؟

أشارككم قصة حقيقية من بداياتي، وكيف تعلمت بالطريقة الصعبة أن المهمة البرمجية ليست مجرد كتابة كود، بل هي فرصة لإظهار طريقة تفكيرك. اكتشف كيف يمكن...

4 يونيو، 2026 قراءة المزيد

التوسع والأداء العالي والأحمال

نمط قاطع الدائرة: كيف نجا نظامنا من جحيم الانهيارات المتسلسلة؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف تحول فشل بسيط في إحدى الخدمات إلى انهيار كارثي للنظام بأكمله. واكتشفوا معنا نمط "قاطع الدائرة" (Circuit...

4 يونيو، 2026 قراءة المزيد