ذكاء اصطناعي

نماذجنا اللغوية كانت تهلوس: كيف أنقذنا التوليد المعزز بالاسترجاع (RAG) من جحيم المعلومات الخاطئة؟

أبو عمر 13 أبريل، 2026 2 دقائق قراءة

يا جماعة الخير، السلام عليكم ورحمة الله. معكم أخوكم أبو عمر.

قبل كم شهر، كنت شغال مع فريقي على مشروع طموح: بناء مساعد ذكي لمتجر إلكتروني كبير يبيع أجهزة إلكترونية. الهدف كان واضح، بدنا مساعد يرد على أسئلة الزبائن بخصوص مواصفات المنتجات، مقارنات، توصيات، وهالأمور. استخدمنا واحد من أقوى النماذج اللغوية الكبيرة (LLM) وقتها، ودربناه تدريب خفيف، وكنا مبسوطين بالنتائج الأولية. كان “ذكي” وبيرد بسرعة وبأسلوب طبيعي.

لحد ما إجا يوم… وصلتنا رسالة من صاحب المتجر، معصّب شوي. زبون سأل المساعد الذكي: “هل هاتف [اسم الهاتف] مقاوم للماء بمعيار IP68؟”. المساعد، بكل ثقة، جاوب: “نعم بالتأكيد! هاتف [اسم الهاتف] حاصل على شهادة IP68 ويمكن غمره في الماء حتى عمق 1.5 متر لمدة 30 دقيقة”.

المشكلة؟ الهاتف يا جماعة مش مقاوم للماء بالمرة! هو مقاوم للرذاذ فقط. الزبون كان على وشك يشتري الهاتف بناءً على هالمعلومة الخاطئة. تخيلوا الكارثة لو الزبون اشتراه ونزل فيه على المسبح! وقتها أدركت إننا بنواجه عدو خفي اسمه “الهلوسة” (Hallucination). النموذج اللغوي كان “يخترع” حقائق من عنده ليبدو واثقاً ومساعداً. هنا كانت بداية رحلتنا مع المنقذ: تقنية الـ RAG.

لماذا “تهلوس” نماذجنا اللغوية؟

قبل ما نغوص في الحل، خلينا نفهم المشكلة من جذورها. النماذج اللغوية الكبيرة (LLMs) مثل GPT-4 وغيرها، هي بالأساس آلات تنبؤ بالكلمات. هي تعلمت من كميات هائلة من نصوص الإنترنت، وصارت تعرف شو الكلمة اللي على الأغلب بتيجي بعد مجموعة كلمات معينة. هي ما “بتفهم” الحقيقة بالمعنى البشري.

تخيلها مثل طالب ذكي جداً قرأ كل كتب المكتبة، بس لما تسأله سؤال في الامتحان، هو ما بيفتح الكتاب ليتأكد، بل بيجاوب من ذاكرته الضخمة. أحياناً ذاكرته بتكون ممتازة، وأحياناً بيخلط بين المعلومات أو “بيألّف” تفاصيل لتبدو إجابته منطقية ومتماسكة. هذا التأليف هو بالزبط ما نسميه الهلوسة.

المشكلة بتكبر لما نستخدم هاي النماذج في تطبيقات حساسة بتتطلب دقة 100%، مثل:

أنظمة الدعم الفني للعملاء.
مساعدين قانونيين أو طبيين.
أنظمة تحليل البيانات المالية الداخلية للشركات.

هون ما في مجال للمعلومات المغلوطة. الثقة هي كل شيء.

المنقذ: ما هو التوليد المعزز بالاسترجاع (RAG)؟

هون بيجي دور بطل قصتنا: التوليد المعزز بالاسترجاع (Retrieval-Augmented Generation) أو اختصاراً RAG. الفكرة عبقرية وبسيطة في نفس الوقت.

بدل ما نسأل النموذج اللغوي السؤال مباشرة ونتركه يجاوب من “ذاكرته” الواسعة والممكن تكون خاطئة، إحنا بنعمل خطوة إضافية أولاً:

“يا نموذج يا لغوي، قبل ما تجاوب على هالسؤال، هي فقرة من مستند موثوق (كتالوج المنتج الرسمي مثلاً) بتحتوي على الجواب. اقرأها، وبعدين جاوب على السؤال بناءً عليها فقط.”

بهذه الطريقة، إحنا بنجبر النموذج اللغوي على الاعتماد على مصدر حقيقة خارجي وموثوق بدل الاعتماد على ذاكرته الداخلية. بنحوّله من “طالب بيجاوب من الذاكرة” إلى “باحث بيفتح الكتاب وبيقرأ المعلومة قبل ما يجاوب”. شغل نظيف ومضمون.

كيف يعمل RAG “تحت غطاء المحرك”؟

العملية بتتقسم لمرحلتين أساسيتين: مرحلة الاسترجاع ومرحلة التوليد. خلينا نفصلهم.

المرحلة الأولى: الاسترجاع (The Retrieval) – البحث عن الإبرة في كومة قش

هاي هي المرحلة اللي بنلاقي فيها المعلومة الصحيحة. عشان نعمل هيك، بنحتاج نجهز قاعدة بياناتنا المعرفية (Knowledge Base) اللي ممكن تكون ملفات PDF، صفحات موقع، مستندات وورد، إلخ.

التجزئة (Chunking): بنقسّم مستنداتنا الكبيرة لقطع صغيرة (chunks). ليش؟ لأن النماذج اللغوية عندها حد معين من الكلمات اللي بتقدر تقرأها مرة وحدة (context window)، وكمان عشان البحث يكون أدق.
التضمين (Embedding): هاي هي الخطوة السحرية. بنستخدم نموذج ذكاء اصطناعي متخصص (Embedding Model) عشان يحوّل كل قطعة نصية إلى متجه رياضي (Vector). هذا المتجه هو عبارة عن قائمة طويلة من الأرقام بتمثل “معنى” النص. النصوص اللي معانيها متشابهة بتكون متجهاتهم الرياضية قريبة من بعضها في الفضاء المتجهي.
التخزين (Indexing): بنخزن كل هاي المتجهات في قاعدة بيانات متخصصة اسمها “قاعدة بيانات المتجهات” (Vector Database) مثل FAISS, Pinecone, أو ChromaDB. هاي القاعدة مصممة خصيصاً للبحث السريع عن المتجهات المتشابهة.

هلّق، لما يجي المستخدم ويسأل سؤال، إحنا بنحوّل سؤاله هو كمان لمتجه بنفس الطريقة، وبعدين بنروح على قاعدة البيانات وبنقولها: “أعطيني أكثر قطع نصية متجهاتهم قريبة من متجه السؤال هاد”. والنتيجة بتكون هي المستندات الأكثر صلة بالسؤال.

المرحلة الثانية: التعزيز والتوليد (The Augmentation & Generation)

بعد ما استرجعنا القطع النصية ذات الصلة (خل نسميها “السياق” أو Context)، بتصير العملية سهلة:

بناء الأمر (Prompt Augmentation): بنبني أمر (Prompt) جديد للنموذج اللغوي الكبير. هذا الأمر بيكون مركب ومفصل، وبيحتوي على جزئين رئيسيين:
- السياق المسترجع: “بناءً على المعلومات التالية: [هنا نضع النصوص التي تم استرجاعها]”.
- السؤال الأصلي: “أجب على السؤال التالي: [هنا نضع سؤال المستخدم]”.
التوليد (Generation): بنرسل هذا الأمر الكامل للنموذج اللغوي (مثل GPT-4). النموذج هلّق عنده كل شي بيحتاجه: عنده السياق الموثوق وعنده السؤال. كل اللي عليه يعمله هو إنه يصيغ إجابة طبيعية بناءً على المعلومات اللي أعطيناه إياها.

وبهيك، بنكون حصلنا على إجابة دقيقة، موثوقة، ومبنية على حقائق، مش هلوسات.

ورشة عمل أبو عمر: بناء أول نظام RAG بسيط

الكلام النظري حلو، بس خلينا نشوف كود حقيقي. راح نستخدم مكتبة langchain في بايثون، لأنها بتسهل العملية جداً. راح نفترض إن عندنا ملف نصي بسيط my_knowledge.txt بيحتوي على معلومات منتجاتنا.

محتوى ملف my_knowledge.txt:


هاتف "Pixel Pro 8" يتميز بكاميرا 50 ميجابكسل ومعالج Tensor G3. الهاتف مقاوم للرذاذ فقط بمعيار IP54 ولا يجب غمره في الماء.
ساعة "Galaxy Watch 6" تأتي بشاشة Super AMOLED وبطارية تدوم يومين. الساعة مقاومة للماء بمعيار IP68 ومناسبة للسباحة.

هلّق، الكود بلغة بايثون:


# أولاً، نحتاج لتثبيت المكتبات اللازمة
# pip install langchain langchain-openai faiss-cpu python-dotenv

import os
from dotenv import load_dotenv

# لتحميل مفتاح API الخاص بـ OpenAI من ملف .env
load_dotenv()
# تأكد من وجود OPENAI_API_KEY="sk-..." في ملف .env

from langchain_community.document_loaders import TextLoader
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import CharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain.chains import RetrievalQA
from langchain_openai import OpenAI

# 1. تحميل المستندات
print("الخطوة 1: تحميل المستندات...")
loader = TextLoader("my_knowledge.txt", encoding="utf-8")
documents = loader.load()

# 2. تجزئة المستندات إلى قطع صغيرة
print("الخطوة 2: تجزئة المستندات...")
text_splitter = CharacterTextSplitter(chunk_size=300, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

# 3. إنشاء التضمينات (Embeddings) وتخزينها في قاعدة بيانات متجهات (FAISS)
print("الخطوة 3: إنشاء قاعدة بيانات المتجهات...")
embeddings = OpenAIEmbeddings()
db = FAISS.from_documents(docs, embeddings)

# 4. إعداد سلسلة الاسترجاع والإجابة
print("الخطوة 4: إعداد سلسلة RAG...")
# سنستخدم db كـ "مسترجع" للمعلومات
retriever = db.as_retriever()
qa_chain = RetrievalQA.from_chain_type(
    llm=OpenAI(temperature=0), # temperature=0 لتقليل الإبداع والهلوسة
    chain_type="stuff", # "stuff" تعني وضع كل السياق في أمر واحد
    retriever=retriever
)

# 5. طرح الأسئلة!
print("الخطوة 5: طرح الأسئلة...")
question1 = "هل هاتف Pixel Pro 8 مقاوم للماء؟"
answer1 = qa_chain.invoke(question1)
print(f"سؤال: {question1}")
print(f"جواب: {answer1['result']}")

print("-" * 20)

question2 = "ما هي مواصفات بطارية ساعة Galaxy Watch 6؟"
answer2 = qa_chain.invoke(question2)
print(f"سؤال: {question2}")
print(f"جواب: {answer2['result']}")

لما تشغل هالكود، راح تلاحظ إن الإجابة على السؤال الأول راح تكون دقيقة جداً: “الهاتف مقاوم للرذاذ فقط بمعيار IP54 ولا يجب غمره في الماء.”، لأنه استرجع المعلومة الصحيحة من الملف النصي.

نصائح من الخبير: كيف تجعل نظام RAG الخاص بك “شغل نظيف”؟

بناء نظام RAG أساسي سهل، بس عشان تخليه احترافي وموثوق، في شوية تفاصيل بتفرق كثير:

تقطيع المستندات بذكاء (Smart Chunking): الطريقة اللي بتقطع فيها مستنداتك ممكن تدمر أو تنجح نظامك. لا تقطع الجمل في نصفها. حاول تخلي كل قطعة (chunk) مكتفية ذاتياً. في تقنيات متقدمة مثل “Recursive Character Text Splitter” في LangChain بتساعد بهالموضوع.
اختيار نموذج التضمين (Embedding Model) المناسب: مش كل نماذج التضمين زي بعض. في نماذج أفضل للنصوص الطويلة، ونماذج أفضل للجمل القصيرة، ونماذج بتدعم لغات متعددة. استثمر وقت في تجربة نماذج مختلفة وشوف أي واحد بيعطي أفضل نتائج استرجاع لبياناتك.
هندسة الأوامر (Prompt Engineering) للـ RAG: الأمر اللي بتبعته للنموذج اللغوي مهم جداً. لازم يكون واضح وصريح. ضيف عليه تعليمات مثل: “أجب على السؤال بناءً على السياق المقدم فقط. إذا كانت الإجابة غير موجودة في السياق، قل بوضوح ‘لا أملك معلومات كافية للإجابة على هذا السؤال'”. هذا بيمنع النموذج من الرجوع لذاكرته الخاصة والهلوسة.

الخلاصة: لا تثق، بل تحقق! 💡

يا جماعة، عالم الذكاء الاصطناعي التوليدي عالم مبهر، لكنه بيحمل معه مسؤولية كبيرة. الاعتماد الأعمى على النماذج اللغوية الكبيرة في التطبيقات الحساسة هو وصفة لكارثة. تقنية RAG مش مجرد أداة تقنية، هي تغيير في العقلية: من عقلية “الثقة العمياء” إلى عقلية “الثقة المبنية على التحقق”.

نصيحتي الأخيرة لكم: لما تبنوا أي تطبيق يعتمد على الذكاء الاصطناعي لتقديم معلومات، اسألوا حالكم دايماً: “من وين بتيجي الحقيقة؟”. إذا كان الجواب هو “من ذاكرة النموذج الداخلية فقط”، فأنتم في منطقة الخطر. استخدموا RAG لترسيخ نماذجكم في أرض الواقع، وربطها بمصادر الحقيقة الخاصة بكم. وقتها فقط، بتقدروا تقدموا لعملائكم تجربة ذكية وموثوقة في نفس الوقت.

أتمنى تكون المقالة مفيدة. الله يوفقكم في مشاريعكم.

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

مفارقة الخصوصية في عصر الذكاء الاصطناعي: المراقبة والصندوق الأسود للبيانات

بودكاست

ذكاء اصطناعي

مفارقة الخصوصية في عصر الذكاء الاصطناعي: المراقبة والصندوق الأسود للبيانات

الغوص في أعماق مفارقة الخصوصية في عصر الذكاء الاصطناعي، حيث تتصادم الرغبة في التكنولوجيا المتقدمة مع المخاوف المتزايدة بشأن المراقبة واستغلال البيانات. اكتشف كيف يمكننا...

31 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

بحثنا كان يطابق الكلمات لا المعاني: كيف أنقذتنا ‘قواعد بيانات المتجهات’ من جحيم النتائج غير ذات الصلة؟

أشارككم قصة من واقع العمل، حين كاد نظام بحث فاشل أن يدمر مشروعًا بأكمله. سنغوص في عالم قواعد بيانات المتجهات (Vector Databases) ونكتشف كيف حولت...

12 أبريل، 2026 قراءة المزيد

بودكاست

ذكاء اصطناعي

الذكاء الاصطناعي في الطب: ثورة الخوارزميات في التشخيص والعلاج (تجربتي كمبرمج فلسطيني)

اكتشف كيف يُحدث الذكاء الاصطناعي ثورة في الطب، من التشخيص الدقيق إلى العلاجات الشخصية. هذه المقالة تستعرض التطبيقات العملية للخوارزميات في تحسين الرعاية الصحية، مع...

24 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

السيادة الرقمية 2026: كيف تشغل نماذج الذكاء الاصطناعي الجبارة على حاسوبك الشخصي؟ (دليل عملي مع Ollama وUnsloth)

في عالم تتصاعد فيه مخاوف الخصوصية وتكاليف السحابة، نستكشف كيف تمكّنك النماذج اللغوية الصغيرة (SLMs) وأدوات مثل Ollama وUnsloth من استعادة السيطرة الكاملة على بياناتك....

12 يناير، 2026 قراءة المزيد

بودكاست

ذكاء اصطناعي

الجيل الجديد من الذكاء الاصطناعي التوليدي: ثورة الإبداع والابتكار قادمة!

اكتشف كيف تُعيد نماذج الذكاء الاصطناعي التوليدية تعريف الإبداع والابتكار. من كتابة الشعر إلى تصميم المباني، تعرف على الأدوات والتقنيات التي ستشكل المستقبل.

24 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

روبوتات المحادثة: قفزة نوعية في عالم الذكاء الاصطناعي والتفاعلات الرقمية

استكشف كيف سيُحدث الجيل القادم من روبوتات المحادثة ثورة في تفاعلاتنا الرقمية. من فهم أعمق للغة إلى استجابات أكثر تخصيصًا، تعرف على مستقبل هذه التقنية...

24 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

ثورة التريليون دولار: كيف سيُغير الذكاء الاصطناعي وجه الطب إلى الأبد؟

من واقع تجربة شخصية، أسرد لكم كيف ينتقل الذكاء الاصطناعي من مجرد أداة مساعدة إلى محرك أساسي في التشخيص الطبي والرعاية الصحية، مُحدثًا ثورة اقتصادية...

4 فبراير، 2026 قراءة المزيد

ذكاء اصطناعي

روبوت سناب شات في قفص الاتهام: هل أصبحت دردشات أطفالنا وقودًا للذكاء الاصطناعي؟

بصفتي أبو عمر، مبرمج فلسطيني، أسرد لكم قصة روبوت "My AI" من سناب شات وكيف أثار تحقيق بريطاني مخاوف جدية حول استخدام محادثات الأطفال لتدريب...

9 فبراير، 2026 قراءة المزيد

ذكاء اصطناعي

معضلة الـ 0.5%: كيف سيصنع الذكاء الاصطناعي العربي مستقبل الاقتصاد الرقمي؟

من واقع تجربة شخصية، أنا أبو عمر، مطور فلسطيني، أسرد لكم كيف أن فجوة البيانات العربية في الذكاء الاصطناعي التي لا تتجاوز 0.5% ليست مجرد...

4 فبراير، 2026 قراءة المزيد

آخر المدونات

نصائح برمجية

شروطنا المتداخلة كانت هرم الهلاك: كيف أنقذتنا ‘الشروط الحارسة’ (Guard Clauses) من جحيم التعقيد؟

أتذكر ليلة قضيتها في تصحيح خطأ برمجي في نظام قديم، حيث كانت الشروط المتداخلة (Nested Ifs) تبني "هرم الهلاك" الذي كاد يدفعني للجنون. في هذه...

13 أبريل، 2026 قراءة المزيد

معمارية البرمجيات

خدماتنا كانت في علاقة سامة: كيف أنقذتنا ‘المعمارية القائمة على الأحداث’ (EDA) من جحيم الاقتران الخانق؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، يوم كاد "الاقتران الخانق" بين خدماتنا أن يدمر إطلاقاً مهماً. اكتشفوا كيف كانت "المعمارية القائمة على الأحداث" (EDA)...

13 أبريل، 2026 قراءة المزيد