ذكاء اصطناعي

نماذجنا اللغوية كانت تهذي! كيف أنقذنا الذكاء الاصطناعي من الهلوسة بتقنية RAG؟

أبو عمر 28 مايو، 2026 2 دقائق قراءة

يا جماعة الخير، خلوني أحكيلكم قصة صارت معي ومع فريقي قبل كم شهر. كنا شغالين على مشروع كبير، بنبني مساعد ذكي لشركة ضخمة عندها آلاف الوثائق الداخلية: سياسات موارد بشرية، أدلة فنية، تقارير سنوية… إشي من كل لون وشكل. الهدف كان بسيط: الموظف يسأل الشات بوت أي سؤال، والبوت يجاوبه فوراً بدل ما يضيع ساعات وهو يبحث في الملفات.

في البداية، استخدمنا واحد من النماذج اللغوية الكبيرة (LLM) المشهورة. عملنا شوية تعديلات وبدأنا الاختبارات الأولية. أول كم يوم كنا طايرين من الفرحة، النموذج كان ذكي وبيفهم الأسئلة المعقدة. لكن… الكارثة بلشت تبين شوي شوي.

موظف يسأل: “ما هي سياسة الإجازة المرضية الطارئة؟” النموذج يخترع سياسة جديدة من راسه! يعطي عدد أيام غلط وشروط مش موجودة أصلاً. مهندس يسأل عن كود معين في دليل فني، النموذج يعطيه دالة مش موجودة ويحلف إنها الحل السحري. صار النموذج “يهلوس” أو “يهذي” (Hallucination)، زي ما بنحكي بالمصطلح التقني. صار يحكي من راسه، زي كأنه شارب فنجان قهوة زيادة وبده يفتي بكل إشي. الإدارة العليا كانت على وشك تلغي المشروع كله، والوضع كان متأزم جداً.

في عز اليأس، لمعت في بالنا فكرة: “ليش نعتمد على ذاكرة النموذج المحدودة والمُدربة مسبقاً؟ ليش ما نخليه يعمل زينا إحنا البشر لما ننسى إشي؟ يفتح الكتاب ويدور على المعلومة قبل ما يحكي!”. ومن هنا بدأت رحلتنا مع المنقذ: التوليد المعزز بالاسترجاع أو الـ RAG. وهذه هي القصة اللي بدي أحكيلكم إياها اليوم.

شو قصة “هلوسة” الذكاء الاصطناعي؟

قبل ما نغوص في الحل، لازم نفهم أصل المشكلة. النماذج اللغوية الكبيرة، مثل GPT-4 وغيرها، هي بالآخر عبارة عن محركات إحصائية عملاقة للتنبؤ بالكلمات. هي لا “تفهم” العالم مثلنا، بل تعلمت من كميات هائلة من نصوص الإنترنت كيف تكمل الجمل بطريقة منطقية ومقنعة.

المشكلة بتصير لما تسألها عن معلومة مش موجودة في بيانات تدريبها، أو معلومة متخصصة جداً (مثل سياسات شركتك الداخلية). هنا، النموذج بوقع في حيرة. وبدل ما يحكيلك “ما بعرف”، بحاول “يرضيك” عن طريق توليد إجابة تبدو مقنعة إحصائياً، لكنها في الحقيقة مجرد تخمين إبداعي… أو كذبة جميلة. هذه هي الهلوسة.

الحل القديم: الضبط الدقيق (Fine-Tuning) وليش ما كان كافي

أول إشي فكرنا فيه كان الـ Fine-tuning. يعني ناخذ النموذج الأساسي و”نعيد تدريبه” على وثائقنا الخاصة. هذا الأسلوب مفيد لتحسين أسلوب النموذج أو تعليمه مصطلحات معينة. لكن بالنسبة لمشكلتنا، كان له عيوب قاتلة:

مكلف جداً: إعادة تدريب نموذج عملاق تحتاج قوة حاسوبية هائلة ووقت طويل.
المعلومات بتصير قديمة: لو تغيرت سياسة واحدة في الشركة، لازم نعيد التدريب من جديد. هذا إشي مش عملي بالمرة.
لا يمنع الهلوسة تماماً: حتى بعد التدريب، النموذج ممكن يظل يهلوس لو سألته سؤال بطريقة غير متوقعة.

كنا محتاجين حل أذكى، أكثر ديناميكية، وأقل تكلفة. حل يخلي النموذج “يقرأ” المستندات الحقيقية قبل كل إجابة.

المنقذ RAG: التوليد المعزز بالاسترجاع

وهنا يأتي دور بطل قصتنا، الـ RAG. فكرته بسيطة بشكل عبقري، وتقدر تشبهها تماماً بـ “امتحان الكتاب المفتوح” (Open-book exam) للذكاء الاصطناعي.

إيش الفكرة بالضبط؟

بدل ما نطلب من النموذج إنه يجاوب من “ذاكرته” (بيانات تدريبه)، إحنا بنقوم بالخطوات التالية قبل ما نخليه يكتب حرف واحد:

الاسترجاع (Retrieval): لما المستخدم يسأل سؤال، أول إشي بنعمله هو البحث في قاعدة بياناتنا المعرفية (وثائق الشركة في حالتنا) عن أكثر المعلومات صلة بالسؤال.
التعزيز (Augmentation): بناخذ المعلومات اللي لقيناها وبنضيفها لسؤال المستخدم الأصلي.
التوليد (Generation): بنقدم هذا “الطلب المعزز” (السؤال + المعلومات المسترجعة) للنموذج اللغوي، وبنطلب منه يجاوب على السؤال بالاعتماد على السياق اللي أعطيناه إياه فقط.

بهذه الطريقة، إحنا بنجبر النموذج على الاعتماد على مصدر الحقيقة (وثائقنا) بدل الاعتماد على ذاكرته العامة اللي ممكن تكون خاطئة أو غير محدثة.

آلية عمل RAG خطوة بخطوة

عشان الصورة تكون أوضح، خلينا نفصل العملية لمراحل تقنية أكثر. في مرحلتين أساسيتين: مرحلة التجهيز (مرة واحدة)، ومرحلة الاستعلام (مع كل سؤال).

المرحلة الأولى: الفهرسة والتجهيز (Indexing)

هذه المرحلة بنعملها مرة واحدة في البداية، وكل ما نضيف وثائق جديدة بنعيدها.

تقطيع المستندات (Chunking): بنمسك كل مستنداتنا (PDFs, DOCX, etc.) وبنقطعها لقطع صغيرة ومنطقية (chunks). كل قطعة ممكن تكون فقرة أو بضع جمل.
الترميز وتحويلها لمتجهات (Embedding): بنستخدم نموذج embedding خاص (مثل نماذج Sentence-Transformers) عشان نحول كل قطعة نصية إلى متجه رقمي (vector). هذا المتجه هو تمثيل رياضي لمعنى النص.
التخزين في قاعدة بيانات متجهات (Vector Database): بنخزن كل هذه المتجهات النصية في قاعدة بيانات متخصصة مثل ChromaDB, Pinecone, أو FAISS. هذه القاعدة بتسمحلنا نبحث بسرعة عن المتجهات المتشابهة.

المرحلة الثانية: الاسترجاع والتوليد (مع كل سؤال)

المستخدم يسأل سؤال: مثلاً “كم عدد أيام الإجازة السنوية؟”.
نحول السؤال إلى متجه رقمي باستخدام نفس نموذج الـ embedding.
نبحث في قاعدة البيانات عن المتجهات (القطع النصية) الأكثر تشابهاً لمتجه السؤال. هذا هو “الاسترجاع”.
نأخذ أفضل 3-5 قطع نصية وجدناها ونبني “موجه الأوامر” (Prompt) النهائي.
نرسل هذا الموجه للنموذج اللغوي الكبير (LLM).

مثال على الموجه النهائي الذي يراه الـ LLM:
“أجب على السؤال التالي بناءً على السياق المرفق فقط. إذا كانت الإجابة غير موجودة في السياق، قل ‘لا أعرف’.

— السياق —
القطعة النصية 1: ‘…وفقاً للمادة 5 من قانون العمل، يستحق الموظف الذي أكمل سنة من الخدمة إجازة سنوية مدتها 21 يوماً…’
القطعة النصية 2: ‘…تزيد الإجازة السنوية إلى 30 يوماً للموظفين الذين تجاوزت مدة خدمتهم عشر سنوات…’
— نهاية السياق —

السؤال: كم عدد أيام الإجازة السنوية؟”

الآن، النموذج عنده كل المعلومات اللي بيحتاجها عشان يعطي إجابة دقيقة ومبنية على مصدر موثوق، بدل ما “يهلوس”.

يلا نبرمج: مثال بسيط لـ RAG باستخدام Python

الحكي النظري حلو، بس خلينا نشوف كود. هذا مثال مبسط جداً باستخدام مكتبات `langchain` و `chromadb` و `sentence-transformers` عشان نوضح الفكرة.


# First, install the necessary libraries
# pip install langchain langchain-community langchain-openai sentence-transformers chromadb

from langchain_community.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings.sentence_transformer import (
    SentenceTransformerEmbeddings,
)
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

# --- 1. Indexing Phase ---

# Imagine this is our internal document
document_text = """
سياسة الإجازات في شركة 'تقنية بلا حدود'

المادة 1: الإجازة السنوية
يستحق كل موظف إجازة سنوية مدفوعة الأجر مدتها 25 يوم عمل بعد إكمال السنة الأولى من الخدمة.

المادة 2: الإجازة المرضية
يُمنح الموظف إجازة مرضية تصل إلى 14 يوماً في السنة بناءً على تقرير طبي معتمد.

المادة 3: إجازة الأبوة
يستحق الأب إجازة مدتها 5 أيام عمل عند ولادة طفل جديد.
"""

# Save it to a temporary file to simulate loading
with open("policy.txt", "w", encoding="utf-8") as f:
    f.write(document_text)

# Load the document
loader = TextLoader("policy.txt", encoding="utf-8")
documents = loader.load()

# Split the document into chunks
text_splitter = CharacterTextSplitter(chunk_size=300, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

# Create the embedding model
embedding_function = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")

# Load it into ChromaDB (our vector store)
vectorstore = Chroma.from_documents(docs, embedding_function)

# --- 2. Retrieval and Generation Phase ---

# Create a retriever which finds relevant documents
retriever = vectorstore.as_retriever()

# Define the prompt template
template = """
Answer the question based only on the following context:
{context}

Question: {question}
"""
prompt = ChatPromptTemplate.from_template(template)

# Define the LLM model (you need an OpenAI API key for this)
model = ChatOpenAI()

# Create the RAG chain
rag_chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | model
    | StrOutputParser()
)

# Now, let's ask a question!
question = "كم يوم إجازة الأبوة في الشركة؟"
response = rag_chain.invoke(question)

print(f"السؤال: {question}")
print(f"الإجابة: {response}")
# Expected Output: الإجابة: يستحق الأب إجازة مدتها 5 أيام عمل عند ولادة طفل جديد.

# Ask another question
question_2 = "ما هي سياسة الشركة بخصوص إجازة الحج؟"
response_2 = rag_chain.invoke(question_2)
print(f"السؤال: {question_2}")
print(f"الإجابة: {response_2}")
# The model might say it doesn't know, which is the correct behavior!

نصيحة من أبو عمر:

الكود اللي فوق هو مثال بسيط. في المشاريع الحقيقية، الموضوع بصير أعقد. بدك تهتم بجودة تقطيع النصوص (Chunking Strategy)، واختيار نموذج الـ embedding المناسب، وتحسين أداء الـ retriever. كل خطوة من هدول هي علم بحد ذاتها وبتحتاج تجربة وقياس.

ليش الـ RAG غير قواعد اللعبة؟

دقة وموثوقية: قلل الهلوسة بشكل كبير جداً. الإجابات صارت مبنية على حقائق موثقة.
تحديث فوري للمعلومات: إذا تغيرت وثيقة، كل اللي علينا نعمله هو تحديثها في قاعدة البيانات وإعادة فهرستها. لا حاجة لإعادة تدريب النموذج بالكامل.
الشفافية: نقدر بسهولة نعرض للمستخدم المصدر اللي جبنا منه الإجابة (أي قطعة نصية استخدمناها)، وهذا بيزيد الثقة في النظام.
فعالية من حيث التكلفة: أرخص بكثير من الـ Fine-tuning المستمر لنماذج عملاقة.

الخلاصة: من جحيم الهلوسة إلى أرض الثقة 🚀

في النهاية، تقنية RAG ما كانت مجرد حل تقني لمشكلتنا، بل كانت نقلة نوعية في طريقة تفكيرنا في بناء تطبيقات الذكاء الاصطناعي. حولت النماذج اللغوية من “مبدعين” لا يمكن التنبؤ بهم إلى “باحثين” دقيقين ومساعدين موثوقين.

إذا كنت تبني أي تطبيق يعتمد على نموذج لغوي كبير للإجابة على أسئلة بناءً على مجموعة محددة من المعرفة (سواء كانت وثائق شركة, قاعدة بيانات منتجات, أو حتى كتب علمية)، فأنصحك بشدة أن تضع RAG في قلب تصميمك. هي الجسر الذي ينقلنا من الإعجاب بقدرات الذكاء الاصطناعي إلى الثقة الحقيقية في مخرجاته.

بالآخر، زي ما بحكي المثل، “اسأل مجرّب ولا تسأل حكيم”. وأنا كمجرّب، بحكيلكم إن الـ RAG هو طوق النجاة اللي كنا بندور عليه. يلا شدوا حيلكم وجربوها!

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

ذكاء اصطناعي

كان بحثنا يفهم الكلمات لا المعاني: كيف أنقذتنا ‘التضمينات المتجهة’ (Vector Embeddings) من جحيم البحث الحرفي؟

بتذكر مرة كنا بنبني نظام بحث داخلي لشركة، وكان الموظف يسأل "كيف آخذ إجازة مرضية؟" والنظام ما يرجعله إشي، لأن المستند الرسمي عنوانه "سياسة الإجازات...

23 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

من الشيفرة إلى الجسد: كيف غيرت الروبوتات الإنسانية عالمنا في 2026؟ شهادة أبو عمر من قلب الميدان

في 2026، خرج الذكاء الاصطناعي من شاشاتنا ليتحرك بيننا. كمهندس فلسطيني، رأيت بأم عيني كيف تحولت الروبوتات الإنسانية من مجرد خيال علمي إلى شريك عمل...

3 فبراير، 2026 قراءة المزيد

ذكاء اصطناعي

كان نموذجنا اللغوي يهلوس: كيف أنقذنا نمط ‘الجلب المعزز للتوليد’ (RAG) من جحيم الإجابات الخاطئة؟

كنا على وشك إطلاق نظام ذكاء اصطناعي لعميل مهم، لكن النموذج بدأ "يهلوس" ويختلق إجابات كارثية. في هذه المقالة، أشارككم قصتنا مع "هلوسة" النماذج اللغوية...

11 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

نماذجنا كانت بطيئة وتلتهم الميزانية: كيف أنقذنا “التحويل الكمي” (Quantization) من جحيم التكاليف وزمن الاستجابة

في هذه المقالة، أشارككم قصة حقيقية من قلب المعركة مع نماذج الذكاء الاصطناعي البطيئة والمكلفة. سأشرح لكم كيف كانت تقنية "التحويل الكمي" أو الـ Quantization...

28 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

حين تأمرك المحكمة بتدمير نموذجك: الذكاء الاصطناعي والبيانات غير القانونية

مقالة من أبو عمر، مطور فلسطيني، تسرد قصة واقعية عن بناء منتج على بيانات مسروقة، وتتعمق في قضايا إجبار الشركات على تدمير نماذج الذكاء الاصطناعي...

10 فبراير، 2026 قراءة المزيد

ذكاء اصطناعي

نماذجنا اللغوية كانت تهذي بثقة: كيف أنقذنا RAG من جحيم فقدان ثقة المستخدم؟

هل سبق لك أن تعاملت مع نموذج لغوي يجيب على أسئلتك بثقة عمياء لكن بمعلومات خاطئة تماماً؟ في هذه المقالة، أشارككم قصة واقعية عن "هلوسة"...

30 أبريل، 2026 قراءة المزيد

ذكاء اصطناعي

كانت إجابات نموذجنا من وحي الخيال: كيف أنقذنا البحث المعزز بالتوليد (RAG) من جحيم الهلوسة؟

أشارككم قصة حقيقية عن "هلوسة" نماذج الذكاء الاصطناعي وكيف تسببت في موقف محرج مع أحد العملاء. سنغوص في أعماق تقنية البحث المعزز بالتوليد (RAG)، ونشرحها...

18 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

كانت توصياتنا ضربة حظ: كيف أنقذنا ‘الترشيح التشاركي’ من جحيم الضياع؟

أشارككم قصة من الميدان، كيف انتقلنا من توصيات عشوائية للمستخدمين إلى نظام ذكي يعتمد على الترشيح التشاركي (Collaborative Filtering). مقالة عملية تشرح المفهوم، أنواعه، مع...

25 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

١٢ ألف مفتاح سري في نماذج الذكاء الاصطناعي: كيف تحول التدريب إلى كارثة أمنية؟

هل تعلم أن نماذج الذكاء الاصطناعي التي نستخدمها يوميًا قد تحتوي على آلاف المفاتيح السرية وكلمات المرور؟ نستعرض قصة حقيقية لكارثة أمنية كشفها باحثون، ونقدم...

6 فبراير، 2026 قراءة المزيد

آخر المدونات

برمجة وقواعد بيانات

تحديثات قاعدة البيانات بدون توقف: كيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من جحيم التوقفات المجدولة؟

هل سئمت من إيقاف الخدمة مع كل تحديث لهيكلة قاعدة البيانات؟ أشارككم قصة حقيقية وكيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من ليالي النشر الطويلة والمُجهدة،...

4 يونيو، 2026 قراءة المزيد

الشبكات والـ APIs

كانت إعادة المحاولة كارثة: كيف أنقذتنا مفاتيح عدم تكرار العمليات (Idempotency Keys) من جحيم الفواتير المزدوجة؟

أشارككم قصة حقيقية من الخنادق البرمجية، يوم كاد خطأ بسيط في إعادة محاولة طلبات الدفع أن يكلفنا سمعتنا وأموال عملائنا. اكتشفوا معنا كيف كانت مفاتيح...

4 يونيو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

كانت مهمتي البرمجية للاختبار مجرد كود: كيف أنقذني توثيق القرارات من جحيم الصمت بعد المقابلة؟

أشارككم قصة حقيقية من بداياتي، وكيف تعلمت بالطريقة الصعبة أن المهمة البرمجية ليست مجرد كتابة كود، بل هي فرصة لإظهار طريقة تفكيرك. اكتشف كيف يمكن...

4 يونيو، 2026 قراءة المزيد

التوسع والأداء العالي والأحمال

نمط قاطع الدائرة: كيف نجا نظامنا من جحيم الانهيارات المتسلسلة؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف تحول فشل بسيط في إحدى الخدمات إلى انهيار كارثي للنظام بأكمله. واكتشفوا معنا نمط "قاطع الدائرة" (Circuit...

4 يونيو، 2026 قراءة المزيد