ذكاء اصطناعي

النموذج اللغوي كان يجهل وثائقنا: كيف أنقذنا ‘التوليد المعزز بالاسترجاع’ (RAG) من جحيم الهلوسة؟

أبو عمر 7 أبريل، 2026 1 دقائق قراءة

يا جماعة الخير، السلام عليكم ورحمة الله.

اسمحوا لي اليوم أحكي لكم قصة صارت معي قبل فترة مش طويلة. تواصلت معنا شركة كبيرة، عندهم أرشيف ضخم من الوثائق الداخلية: سياسات عمل، أدلة فنية للمنتجات، إجراءات تشغيل، يعني كنز من المعلومات لكنه مدفون في آلاف ملفات الـ PDF والـ Word. فكرتهم كانت عبقرية وبسيطة: “يا أبو عمر، بدنا نعمل شات بوت ذكي، الموظف يسأله أي سؤال عن أي إجراء أو سياسة، والشات بوت يجاوبه فوراً من وثائقنا هاي”.

قلت في نفسي “شغل نظيف وسهل”. جبنا أقوى نموذج لغوي كبير (LLM) وقتها، وحاولنا نعمل هندسة أوامر (Prompt Engineering) متقدمة. بدأنا الاختبارات، وكانت الصدمة. سألنا البوت: “ما هي سياسة الإجازة المرضية الطارئة؟”، فكان يجاوبنا إجابة عامة من الإنترنت، أو الأسوأ من هيك، كان “يهلوس” ويخترع سياسة من عنده! تخيلوا موظف ياخذ معلومة غلط عن إجازته أو عن إجراء فني حساس بسبب هلوسة الذكاء الاصطناعي. كارثة محققة.

جلسنا نضرب أخماس بأسداس، والمشكلة واضحة: النموذج اللغوي، على كل ذكائه، لا يعرف شيئاً عن هذه الوثائق الخاصة. تدريبه العام توقف في زمن معين، وهذه البيانات لم تكن جزءاً منه. هنا، لمعت في بالي فكرة كانت وقتها بدأت تنتشر بقوة في مجتمع الذكاء الاصطناعي: تقنية الـ RAG أو “التوليد المعزز بالاسترجاع”. كانت هي المنقذ اللي انتشلنا من جحيم الهلوسة، وحوّل المشروع من فشل محتمل لقصة نجاح بنحكيها اليوم.

ما هو ‘التوليد المعزز بالاسترجاع’ (RAG)؟ ببساطة شديدة

تخيل النموذج اللغوي الكبير (LLM) كطالب ذكي جداً لكنه دخل الامتحان بدون ما يقرأ المادة المطلوبة منه بالزبط. راح يحاول يجاوب من معلوماته العامة، وممكن “يفتي” أو يهلوس.

تقنية RAG، بكل بساطة، هي كأنك بتعطي هذا الطالب “كتاب مفتوح” (Open Book) أثناء الامتحان. هذا الكتاب هو بياناتك ووثائقك الخاصة. قبل ما يجاوب على أي سؤال، الطالب (النموذج اللغوي) بياخذ نظرة سريعة على الصفحات المتعلقة بالسؤال في الكتاب (وثائقك)، وبعدها بصيغ إجابة ذكية ودقيقة بناءً على اللي قرأه.

فالـ RAG لا يعيد تدريب النموذج من الصفر (عملية مكلفة ومعقدة جداً)، بل يزوده بالمعلومات اللازمة “وقت الحاجة” ليجيب على الأسئلة بدقة ومن مصدر موثوق (بياناتك أنت).

كيف يعمل RAG “حبة حبة”؟ (الخطوات التقنية)

العملية بتتقسم لمرحلتين رئيسيتين: مرحلة التجهيز (Indexing) ومرحلة الاستعلام (Querying). خلينا نفصّلها خطوة بخطوة.

المرحلة الأولى: التجهيز وتخزين المعرفة

هذه المرحلة نقوم بها مرة واحدة في البداية، أو كلما تم تحديث وثائقنا.

تقطيع المستندات (Chunking): أول خطوة هي أخذ كل وثائقنا (ملفات PDF, Word, TXT, HTML) وتقطيعها إلى أجزاء أو “قطع” (chunks) صغيرة. ليش؟ لأن النماذج اللغوية لها حدود في كمية النص اللي بتقدر تقرأه مرة واحدة (ما يسمى بـ Context Window). التقطيع بيضمن إننا نعطيها أجزاء مركزة وذات صلة.
إنشاء المتجهات (Embeddings): هنا يبدأ السحر. نأخذ كل “قطعة” نصية ونمررها عبر نموذج متخصص اسمه “نموذج التضمين” (Embedding Model) مثل text-embedding-3-small من OpenAI أو غيره. هذا النموذج يحول النص إلى قائمة طويلة من الأرقام تسمى “متجه” (Vector). هذا المتجه هو بمثابة “بصمة رياضية” لمعنى النص. النصوص اللي معانيها متشابهة بتكون متجهاتِها قريبة من بعض في الفضاء الرياضي.
تخزين المتجهات (Indexing in a Vector DB): الآن، نأخذ كل هذه المتجهات ونخزنها في قاعدة بيانات متخصصة اسمها “قاعدة بيانات متجهة” (Vector Database). أمثلة عليها: Pinecone, ChromaDB, FAISS. وظيفة هذه القاعدة هي أنها سريعة جداً في البحث عن التشابه بين المتجهات.

بانتهاء هذه المرحلة، صار عندك “مكتبة” رقمية ذكية قابلة للبحث الفوري حسب المعنى وليس فقط الكلمات المفتاحية.

المرحلة الثانية: الاستعلام وتوليد الإجابة (وقت سؤال المستخدم)

هذه المرحلة تحدث في كل مرة يسأل فيها المستخدم سؤالاً.

سؤال المستخدم: المستخدم يكتب سؤاله، مثلاً: “كيف أقدم على إجازة عائلية طارئة؟”.
تحويل السؤال إلى متجه: نستخدم نفس “نموذج التضمين” (Embedding Model) لتحويل سؤال المستخدم إلى متجه رقمي.
البحث عن السياق (Retrieval): نأخذ متجه السؤال ونذهب به إلى قاعدة البيانات المتجهة. نطلب منها: “أعطني أفضل 3 أو 5 قطع نصية (chunks) متجهاتها هي الأقرب لمتجه هذا السؤال”. قاعدة البيانات بسرعة البرق بترجع لنا أكثر أجزاء الوثائق صلة بالسؤال.
بناء الأمر المعزز (Augmented Prompt): هنا تكمن العبقرية. نقوم ببناء “أمر” (Prompt) جديد للنموذج اللغوي الكبير. هذا الأمر يحتوي على:
- السياق المسترجع: “بناءً على المعلومات التالية: [نص القطعة الأولى] و [نص القطعة الثانية] و…”
- السؤال الأصلي: “…أجب على السؤال التالي: كيف أقدم على إجازة عائلية طارئة؟”
- تعليمات إضافية: “إذا كانت المعلومة غير موجودة في السياق، قل بوضوح أنك لا تعرف.”
التوليد (Generation): نرسل هذا الأمر المعزز والكامل إلى النموذج اللغوي (مثل GPT-4). الآن، النموذج لن يهلوس، بل سيقرأ السياق الذي قدمناه له ويصيغ إجابة دقيقة ومبنية على وثائقنا الخاصة.

مثال عملي بالكود (يا جماعة الشغل النظيف)

حتى تكون الصورة واضحة، هي مثال بسيط باستخدام Python ومكتبة LangChain الشهيرة التي تسهل بناء أنظمة RAG.

أولاً، تأكد من تثبيت المكتبات اللازمة:

pip install langchain langchain-openai langchain-community chromadb

الآن، لنكتب الكود. سنفترض أن لدينا ملف نصي بسيط اسمه policy.txt.


import os
from langchain_community.document_loaders import TextLoader
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain.text_splitter import CharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain.chains import RetrievalQA

# تأكد من وضع مفتاح OpenAI الخاص بك كمتغير بيئة
# os.environ["OPENAI_API_KEY"] = "sk-..."

# 1. تحميل المستند
loader = TextLoader("./policy.txt")
documents = loader.load()

# 2. تقطيع المستند إلى قطع (chunks)
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

# 3. إنشاء المتجهات وتخزينها في قاعدة بيانات متجهة (ChromaDB في هذه الحالة)
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(texts, embeddings)

# 4. إعداد سلسلة الاسترجاع والتوليد (RAG Chain)
qa = RetrievalQA.from_chain_type(
    llm=ChatOpenAI(temperature=0), 
    chain_type="stuff", 
    retriever=vectorstore.as_retriever()
)

# 5. طرح السؤال
query = "ما هي سياسة العمل عن بعد؟"
response = qa.invoke(query)

print(response['result'])

شرح الكود: الكود يقوم بتحميل ملف نصي، يقطعه، يحول القطع لمتجهات باستخدام OpenAI ويخزنها في قاعدة بيانات Chroma محلية. ثم يبني “سلسلة” (Chain) جاهزة من LangChain تقوم بكل خطوات RAG (استرجاع ثم توليد). أخيراً، نطرح السؤال ونطبع الإجابة التي تم توليدها بناءً على محتوى الملف.

نصائح أبو عمر الذهبية لتطبيق RAG ناجح

من واقع التجربة، هذه بعض النصائح اللي بتفرق جداً في جودة نظام RAG تبعك:

فن التقطيع (Chunking): حجم القطع مهم جداً. قطع صغيرة جداً قد تضيع السياق، وقطع كبيرة جداً قد تحتوي على معلومات غير ضرورية وتشتت النموذج. جرب أحجام مختلفة (مثلاً 500 حرف، 1000 حرف) مع تداخل بسيط بين القطع (overlap) لضمان عدم فقدان المعنى عند حواف التقطيع.
جودة البيانات هي الأساس: “Garbage in, garbage out”. قبل كل شيء، نظّف وثائقك. أزل النصوص غير المهمة (ترويسات، تذييلات الصفحات) ووحّد التنسيق قدر الإمكان. كلما كانت بياناتك أنظف، كانت النتائج أدق.
اختر نموذج التضمين (Embedding) المناسب: ليست كل نماذج التضمين متساوية. بعضها أفضل في فهم النصوص التقنية، وبعضها أفضل في فهم المحادثات. ابحث عن النماذج التي تتناسب مع طبيعة بياناتك.
لا تهمل هندسة الأوامر (Prompt Engineering): حتى مع RAG، طريقة صياغة الأمر النهائي للنموذج اللغوي مهمة. كن واضحاً في تعليماتك: “أجب فقط من السياق المقدم”، “لخّص الإجابة في ثلاث نقاط”، “إذا لم تجد الإجابة، قل لا أعرف”.

الخلاصة… ومن الآخر 💡

تقنية التوليد المعزز بالاسترجاع (RAG) ليست مجرد مصطلح تقني معقد، بل هي حل عملي وفعّال لمشكلة حقيقية جداً: كيف نجعل النماذج اللغوية تتحدث لغة بياناتنا الخاصة وتجيب من مصادرنا الموثوقة بدلاً من “الهلوسة”.

باختصار، RAG يمنح الذكاء الاصطناعي “ذاكرة خارجية” يمكن البحث فيها، مما يفتح الباب لتطبيقات لا حصر لها في خدمة العملاء، والدعم الفني، وتحليل المعرفة الداخلية للشركات، وغيرها الكثير. هي الجسر الذي يربط بين الذكاء العام للنماذج اللغوية والمعرفة الخاصة بمؤسستك.

نصيحتي الأخيرة لك: لا تخف من التجربة. ابدأ بمشروع صغير، استخدم مكتبات مثل LangChain، وجرب بنفسك. متعة رؤية النموذج وهو يجيب بدقة من وثائقك الخاصة لا تضاهيها متعة. يلا، شدوا حيلكم ورجوني إبداعاتكم!

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

ذكاء اصطناعي

كانت مراجعات المستخدمين صراخاً في الظلام: كيف أنقذنا ‘تحليل المشاعر’ من جحيم تجاهل صوت العميل؟

في عالم تتكدس فيه آراء المستخدمين بالآلاف، يصبح تجاهلها جحيماً حقيقياً. أسرد لكم قصتي كـ "أبو عمر"، وكيف تحولنا من ضياع تام في بحر المراجعات...

24 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

متجر الميزات (Feature Store): كيف أنقذنا مشروعنا من جحيم “الانحراف التدريبي-التنبؤي”؟

أشارككم قصة حقيقية عن "الانحراف التدريبي-التنبؤي" (Training-Serving Skew)، الكابوس الصامت الذي كاد أن يدمر أحد مشاريعنا في الذكاء الاصطناعي. اكتشفوا كيف كان "متجر الميزات" (Feature...

13 مايو، 2026 قراءة المزيد

التزييف العميق بالذكاء الاصطناعي, اين الحقيقة؟

بودكاست

ذكاء اصطناعي

الأزمة المعرفية في عصر الذكاء الاصطناعي: كيف نحمي أنفسنا من المعلومات المضللة والتزييف العميق؟

في عصر ينتشر فيه التزييف العميق والمعلومات المضللة، يصبح التمييز بين الحقيقة والخيال تحديًا وجوديًا. هذه المقالة تستكشف الأبعاد المختلفة للأزمة المعرفية وتقدم حلولًا عملية...

30 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

بحثنا كان أعمى للمعنى: كيف أنقذتنا ‘قواعد بيانات المتجهات’ من جحيم البحث الحرفي؟

بتذكر مرة كنا نشتغل على متجر إلكتروني ببيع منتجات تراثية فلسطينية، وكان البحث فيه كارثة. اليوم، بحكيلكم كـ "أبو عمر" كيف انتقلنا من البحث الحرفي...

18 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

كانت نماذجنا صناديق سوداء غامضة: كيف أنقذنا الذكاء الاصطناعي القابل للتفسير (XAI) من جحيم القرارات غير المبررة؟

من قلب تجربة مريرة مع نموذج ذكاء اصطناعي "عنصري" بشكل غير مقصود، يأخذكم أبو عمر في رحلة لكشف أسرار الصناديق السوداء. اكتشف كيف تمكنّا باستخدام...

3 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

كان بحثنا أعمى عن المعنى: كيف أنقذت قواعد بيانات المتجهات (Vector Databases) أنظمتنا من جحيم البحث الحرفي؟

أشارككم قصة من قلب المعاناة مع أنظمة البحث التقليدية، وكيف كانت قواعد بيانات المتجهات (Vector Databases) والبحث الدلالي هي طوق النجاة. هذه المقالة ليست مجرد...

4 مايو، 2026 قراءة المزيد

بودكاست

ذكاء اصطناعي

نهاية “المورد البشري”: عندما يرى الذكاء الاصطناعي أنك عبء تقني! 🤖🔥

هل سيحل الذكاء الاصطناعي محلنا في الوظائف؟ مقال يكشف كيف يمكن لوكلاء الذكاء الاصطناعي أن يروا في الموظفين "عبئًا تقنيًا"، ويستبدلونهم بوكلاء رقميين آخرين. استعدوا...

27 ديسمبر، 2025 قراءة المزيد

ذكاء اصطناعي

نماذجنا اللغوية كانت تهلوس: كيف أنقذنا ‘الاسترجاع المعزز للتوليد’ (RAG) من جحيم الإجابات الخاطئة؟

أشارككم قصة حقيقية من أرض الميدان عن "هلوسة" نماذج الذكاء الاصطناعي وكيف أصبحت تقنية الاسترجاع المعزز للتوليد (RAG) طوق النجاة. هذا دليل عملي، من مبرمج...

15 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

كانت توصياتنا ضربة حظ: كيف أنقذنا ‘الترشيح التشاركي’ من جحيم الضياع؟

أشارككم قصة من الميدان، كيف انتقلنا من توصيات عشوائية للمستخدمين إلى نظام ذكي يعتمد على الترشيح التشاركي (Collaborative Filtering). مقالة عملية تشرح المفهوم، أنواعه، مع...

25 مايو، 2026 قراءة المزيد

آخر المدونات

معمارية البرمجيات

تحديث المونوليث كجراحة قلب مفتوح: كيف أنقذنا نمط الخانق (Strangler Fig) من جحيم “إياك أن تلمس هذا الكود”؟

كانت الساعة قد تجاوزت الثانية صباحاً، وكنت أحدق في شاشة تعرض آلاف الأسطر من كود قديم، وكل تحديث بسيط فيه كان أشبه بعملية جراحية للقلب...

25 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

كانت توصياتنا ضربة حظ: كيف أنقذنا ‘الترشيح التشاركي’ من جحيم الضياع؟

25 مايو، 2026 قراءة المزيد

خوارزميات

كان البحث عن بياناتنا كالبحث عن إبرة في كومة قش: كيف أنقذتنا جداول التجزئة (Hash Tables) من جحيم البحث الخطي؟

في هذه المقالة، أشارككم قصة حقيقية من معاناتنا مع بطء البحث في البيانات وكيف كانت جداول التجزئة (Hash Tables) هي طوق النجاة. سنتعمق في فهم...

25 مايو، 2026 قراءة المزيد

تسويق رقمي

ما وراء الكلمات المفتاحية: كيف حولنا بيانات Schema.org إلى أسلحة سرية في حرب نتائج البحث؟

أنا أبو عمر، مبرمج فلسطيني، وفي هذه المقالة سأشارككم قصة حقيقية حول كيف أنقذنا مشروعًا من الضياع في صفحات جوجل الخلفية باستخدام البيانات المنظمة (Schema.org)....

25 مايو، 2026 قراءة المزيد

تجربة المستخدم والابداع البصري

كانت شاشاتنا الفارغة مقبرة للتفاعل: كيف أنقذتنا ‘الحالات الفارغة الذكية’ من جحيم ‘وماذا الآن؟’

أتذكر جيداً تلك الأيام التي كنا نطلق فيها تطبيقاً جديداً ونراقب بفارغ الصبر أرقام التسجيل، ثم نشاهدها تتحول إلى أرقام مغادرة بنفس السرعة. في هذه...

25 مايو، 2026 قراءة المزيد

برمجة وقواعد بيانات

كانت استعلاماتنا تزحف: كيف أنقذتنا فهارس قواعد البيانات من جحيم البحث البطيء؟

قصة من الميدان عن كيفية تحويل استعلامات SQL البطيئة التي تشبه السلحفاة إلى عمليات فائقة السرعة باستخدام أداة بسيطة وقوية: فهارس قواعد البيانات. مقالة عملية...

25 مايو، 2026 قراءة المزيد

الشبكات والـ APIs

من جحيم الـ Polling إلى نعيم الـ Webhooks: كيف أنقذت “خطافات الويب” تطبيقاتنا من السؤال المستمر “هل من جديد؟”

أروي لكم قصة من واقع تجربتي كمبرمج، كيف انتقلنا من طريقة الاستطلاع المستمر (Polling) المرهقة للخوادم، إلى الاعتماد على "خطافات الويب" (Webhooks) الذكية. مقالة عملية...

25 مايو، 2026 قراءة المزيد

الحوسبة السحابية

كانت خوادمنا نائمة وتكلفتها مستيقظة: كيف أنقذتنا معمارية Serverless من فواتير الموارد الخاملة؟

قصتي مع فاتورة سحابية صادمة لمشروع شبه متوقف، وكيف كان الانتقال إلى معمارية Serverless مثل AWS Lambda هو طوق النجاة الذي أوقف نزيف التكاليف. مقالة...

25 مايو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

ملفي الشخصي كان مقبرة للمشاريع: كيف أنقذتني ‘سردية المشاريع’ من جحيم ‘وماذا بعد؟’

هل ملفك الشخصي مجرد قائمة بمشاريع غير مكتملة أو تطبيقات تعليمية؟ اكتشف كيف حوّلتُ 'مقبرة المشاريع' الخاصة بي إلى قصة نجاح متماسكة باستخدام تقنية 'سردية...

24 مايو، 2026 قراءة المزيد

ما هو ‘التوليد المعزز بالاسترجاع’ (RAG)؟ ببساطة شديدة

كيف يعمل RAG “حبة حبة”؟ (الخطوات التقنية)

المرحلة الأولى: التجهيز وتخزين المعرفة

المرحلة الثانية: الاستعلام وتوليد الإجابة (وقت سؤال المستخدم)

مثال عملي بالكود (يا جماعة الشغل النظيف)

نصائح أبو عمر الذهبية لتطبيق RAG ناجح

الخلاصة… ومن الآخر 💡

سجل دخولك لعمل نقاش تفاعلي

مراجعة رأيك قبل النشر

آراء من النقاشات

مقالات ذات صلة

آخر المدونات