من البحث بـ LIKE إلى محرك بحث احترافي: رحلتي مع الفهرس المعكوس و BM25

أبو عمر 31 يناير، 2026 2 دقائق قراءة

يا أهلاً وسهلاً فيكم، معكم أخوكم أبو عمر.

قبل كم سنة، اتصل فيي صديق قديم، خلينا نسميه “أبو خليل”، كان عنده موقع ببيع فيه تحف ومنتجات يدوية تراثية. كان متحمّس جداً لمشروعه، لكن كان عنده مشكلة قاتلة: الزباين بدخلوا الموقع، ببحثوا عن منتج معين، وما بلاقوا إشي، فبطلعوا فوراً. “يا أبو عمر،” حكالي بصوت محبط، “عندي ألف قطعة أثرية على الموقع، والناس مش لاقية إشي! المبرمج اللي عندي عامل بحث عادي، والنتائج بطيئة ومخبّصة. شو الحل؟”

لما فحصت الموقع، اكتشفت الكارثة. كان البحث عبارة عن استعلام بسيط في قاعدة البيانات: SELECT * FROM products WHERE name LIKE '%keyword%'. هاي الشغلة ممكن تمشي مع 100 منتج، بس مع آلاف المنتجات، كانت الصفحة تحتاج 10 ثواني لتحميل النتائج، والترتيب كان عشوائي تماماً. بحثت عن “مصباح نحاسي قديم”، فطلعلي “خاتم فضة” في أول نتيجة لأنه في وصفه كلمة “قديم”.

هون كانت بداية رحلتنا لتغيير مفهوم البحث عند أبو خليل. قلتله: “اسمع يا خوي، بدنا نبني إشي مرتب، إشي زي جوجل بس لموقعك”. يومها، بنينا أول نسخة من محرك بحث حقيقي باستخدام المبادئ اللي رح أحكيلكم عنها اليوم. هاي القصة مش بس لأبو خليل، هاي لكل واحد فيكم عنده بيانات وبده يخلي الناس توصللها بسهولة وسرعة. يلا نشمّر عن إيدينا ونبدأ.

المشكلة: لماذا البحث التقليدي بـ `LIKE` لا يكفي؟

لنفترض أن لديك مدونة تحتوي على 500,000 مقالة، أو متجر إلكتروني به مليون منتج. عندما يأتي المستخدم ويكتب في مربع البحث، فإنه يتوقع شيئين رئيسيين: السرعة والصلة (Relevance). البحث باستخدام LIKE '%keyword%' في قاعدة بيانات SQL يفشل في تحقيق كليهما بشكل كارثي.

1. بطء قاتل في الأداء

عندما تستخدم LIKE مع علامات النسبة المئوية في البداية والنهاية (%...%)، فإنك تجبر قاعدة البيانات على إجراء فحص كامل للجدول (Full Table Scan). هذا يعني أنها ستقرأ كل سجل في الجدول، وتقارن النص الموجود في الحقل المطلوب مع كلمتك البحثية. مع مليون سجل، هذا يعني مليون عملية مقارنة نصية، وهي عملية بطيئة جداً وتستهلك موارد الخادم بشكل هائل.

2. نتائج غير مرتبة حسب الصلة

قاعدة البيانات لا تفهم “معنى” أو “أهمية” النتائج. هي فقط تبحث عن تطابق. فلو بحث المستخدم عن “هاتف ذكي”، قد تظهر له النتائج التالية بهذا الترتيب:

“غطاء حماية لـهاتف ذكي“
“مقالة عن تاريخ تطور الهاتف الذكي“
“هاتف ذكي جديد بمعالج سنابدراجون”

من الواضح أن النتيجة الثالثة هي الأهم والأكثر صلة، لكن قاعدة البيانات لا تملك آلية لترتيبها في المقدمة. هذا الإحباط يدفع المستخدم لمغادرة موقعك فوراً.

نصيحة من أبو عمر: إذا كان بحثك يستغرق أكثر من نصف ثانية، فأنت تخسر المستخدمين. في عالم اليوم، الصبر عملة نادرة.

الحل الحقيقي: الفهرس المعكوس وخوارزميات الترتيب

محركات البحث الاحترافية مثل Google, Elasticsearch, Solr, Meilisearch لا تعمل بهذه الطريقة البدائية. قلب هذه المحركات النابض يعتمد على مفهومين أساسيين: الفهرس المعكوس (Inverted Index) وخوارزميات الترتيب (Ranking Algorithms).

مفهوم الفهرس المعكوس (Inverted Index)

الفكرة عبقرية في بساطتها. بدلاً من البحث في الوثائق للعثور على كلمة، نقوم بإنشاء فهرس “معكوس” مسبقاً. هذا الفهرس هو ببساطة قاموس يربط كل كلمة فريدة بقائمة الوثائق (أو المقالات/المنتجات) التي تحتوي على هذه الكلمة.

تخيل عندنا 3 وثائق بسيطة:

وثيقة 1 (doc1): “الذكاء الاصطناعي هو المستقبل”
وثيقة 2 (doc2): “تعلم الذكاء الاصطناعي مع بايثون”
وثيقة 3 (doc3): “بايثون لغة المستقبل”

الفهرس المعكوس سيبدو كالتالي (مع معلومات إضافية مثل تكرار الكلمة):


{
  "الذكاء":   [(doc1, 1), (doc2, 1)],
  "الاصطناعي": [(doc1, 1), (doc2, 1)],
  "هو":       [(doc1, 1)],
  "المستقبل": [(doc1, 1), (doc3, 1)],
  "تعلم":     [(doc2, 1)],
  "مع":       [(doc2, 1)],
  "بايثون":   [(doc2, 1), (doc3, 1)],
  "لغة":      [(doc3, 1)]
}

عندما يبحث المستخدم عن “الذكاء بايثون”، كل ما نحتاجه هو:

الذهاب إلى مفتاح “الذكاء” في الفهرس وأخذ قائمة الوثائق: [doc1, doc2].
الذهاب إلى مفتاح “بايثون” وأخذ قائمة الوثائق: [doc2, doc3].
إيجاد التقاطع بين القائمتين: doc2.

هذه العملية سريعة جداً، حتى مع ملايين الوثائق، لأننا نبحث في قاموس منظم بدلاً من فحص كل نص على حدة.

خوارزميات الترتيب: من TF-IDF إلى BM25

الآن بعد أن وجدنا الوثائق التي تحتوي على كلمات البحث، كيف نرتبها؟ هنا يأتي دور خوارزميات الترتيب.

TF-IDF (Term Frequency-Inverse Document Frequency): كانت الخوارزمية الكلاسيكية. فكرتها هي إعطاء وزن لكل كلمة في كل وثيقة. الكلمة تكون مهمة إذا:
- تكررت كثيراً في الوثيقة نفسها (TF).
- وكانت نادرة في مجموعة الوثائق كلها (IDF). كلمة مثل “هو” أو “في” ستحصل على وزن قليل لأنها شائعة جداً.
Okapi BM25 (Best Match 25): هي التطوير الحديث والأكثر فعالية المستخدم في معظم محركات البحث اليوم. هي تأخذ أفضل ما في TF-IDF وتضيف عليه تحسينين رئيسيين:
1. تشبّع تكرار المصطلح (Term Frequency Saturation): في TF-IDF، إذا تكررت الكلمة 10 مرات، يكون وزنها ضعف وزن تكرارها 5 مرات. BM25 تقول “لحظة شوي!”. تكرار الكلمة 10 مرات يجعلها مهمة، لكن ليس بالضرورة ضعف أهمية تكرارها 5 مرات. بعد حد معين، لا تزيد الأهمية بنفس المعدل. هذا منطقي جداً.
2. معايرة طول الوثيقة (Document Length Normalization): ظهور كلمة مرة واحدة في وثيقة من 10 كلمات هو أهم بكثير من ظهورها مرة واحدة في وثيقة من 1000 كلمة. BM25 تأخذ طول الوثيقة في الحسبان بشكل أكثر ذكاءً من TF-IDF.

هذه الآليات هي جوهر محركات البحث القوية مثل Lucene (الذي بُني عليه Elasticsearch و Solr).

مثال عملي: بناء محرك بحث لمدونة تقنية

لنجعل الأمر عملياً. لدينا مدونة تقنية ونريد بناء بحث “Google-like” لمقالاتها. سنمر بالخطوات من الصفر.

الخطوة 1: معالجة النصوص (Text Processing)

البيانات النصية “خام” وفوضوية. قبل بناء الفهرس، يجب تنظيفها وتوحيدها. هذه العملية تسمى Normalization.

Tokenization (الترميز): تقسيم النص إلى وحدات صغيرة تسمى “tokens” (عادةً هي الكلمات).

"بناء محرك بحث احترافي" -> ["بناء", "محرك", "بحث", "احترافي"]
Normalization (التوحيد):
- تحويل كل الحروف إلى حالة صغيرة (Lowercase) للغة الإنجليزية.
- إزالة التشكيل (الفتحة، الضمة، إلخ) من النصوص العربية.
- توحيد الحروف: (أ, إ, آ) -> (ا)، (ة) -> (ه)، (ي) -> (ى) أو العكس حسب المعيار.
- إزالة علامات الترقيم والكلمات الشائعة جداً (Stop Words) مثل “في”, “من”, “على”, “the”, “a”, “is”.
Stemming/Lemmatization (التجذير/الإرجاع للأصل):
- Stemming: عملية أبسط تقوم ببتر أواخر الكلمات للوصول إلى “جذع” مشترك. مثلاً، (“مكتبة”, “مكتبات”, “كاتب”) قد تصبح جميعها “مكتب”. قد لا يكون الجذر صحيحاً لغوياً لكنه يجمع الكلمات المرتبطة.
- Lemmatization: عملية أكثر تعقيداً تستخدم قواعد لغوية لإرجاع الكلمة إلى أصلها المعجمي (lemma). مثلاً، “are”, “is” -> “be”. في العربية، “يكتبون” -> “كتب”.

الخطوة 2: بناء الفهرس المعكوس

بعد معالجة النصوص، سنقوم ببناء الفهرس. سنستخدم قاموس بايثون بسيط كمثال. لكل مقال (doc)، سنقوم بمعالجة نصه ونضيف كلماته (tokens) إلى الفهرس.


# هيكل بيانات مبسط للفهرس
# inverted_index = {
#   "token": {
#     "doc_frequency": 2, # عدد الوثائق التي تحتوي على الكلمة
#     "postings_list": [ (doc_id_1, term_frequency_1), (doc_id_2, term_frequency_2) ]
#   }
# }

# مثال
documents = {
    1: "الذكاء الاصطناعي هو المستقبل",
    2: "تعلم الذكاء الاصطناعي مع بايثون",
    3: "بايثون لغة المستقبل"
}

# بعد المعالجة والتنظيف (تخيل أننا قمنا بها)
processed_docs = {
    1: ["ذكاء", "اصطناعي", "مستقبل"],
    2: ["تعلم", "ذكاء", "اصطناعي", "بايثون"],
    3: ["بايثون", "لغه", "مستقبل"]
}

inverted_index = {}
doc_lengths = {}

for doc_id, tokens in processed_docs.items():
    doc_lengths[doc_id] = len(tokens)
    term_counts = {} # لحساب تكرار الكلمة في الوثيقة الحالية
    for token in tokens:
        term_counts[token] = term_counts.get(token, 0) + 1
    
    for token, tf in term_counts.items():
        if token not in inverted_index:
            inverted_index[token] = []
        inverted_index[token].append((doc_id, tf))

# الفهرس الناتج (بشكل مبسط)
# {
#   "ذكاء": [(1, 1), (2, 1)],
#   "اصطناعي": [(1, 1), (2, 1)],
#   ...
# }

الخطوة 3: البحث وحساب النقاط بـ BM25

عندما يبحث المستخدم، مثلاً عن “ذكاء المستقبل”، نقوم بالآتي:

نعالج استعلام البحث: “ذكاء المستقبل” -> ["ذكاء", "مستقبل"].
نجمع الوثائق المرشحة: نأخذ كل الوثائق التي تحتوي على “ذكاء” أو “مستقبل” من الفهرس. في مثالنا: doc1, doc2, doc3.

نحسب نقاط BM25 لكل وثيقة مرشحة:

معادلة BM25 قد تبدو معقدة، لكن فكرتها بسيطة. لكل كلمة في البحث، ولكل وثيقة، نحسب “نقطة” ثم نجمع النقاط.

النقطة = جزء الـ IDF * جزء الـ TF المعدّل

جزء الـ IDF (Inverse Document Frequency): يقيس مدى ندرة الكلمة. كلما كانت أندر، زادت قيمته.
جزء الـ TF المعدّل: يقيس كم مرة ظهرت الكلمة في الوثيقة، مع الأخذ بعين الاعتبار طول الوثيقة الكلي وتشبع التكرار.

هنا كود بايثون مبسط لتوضيح الفكرة (وليس للتطبيق الفعلي في بيئة الإنتاج):


import math

# ثوابت BM25، يمكن تعديلها
k1 = 1.5
b = 0.75

N = len(documents) # العدد الكلي للوثائق
avgdl = sum(doc_lengths.values()) / N # متوسط طول الوثيقة

def calculate_bm25_score(query_tokens, doc_id):
    score = 0.0
    doc_len = doc_lengths[doc_id]
    
    for token in query_tokens:
        if token not in inverted_index:
            continue
            
        # 1. حساب IDF
        df = len(inverted_index[token]) # Document Frequency
        idf = math.log( (N - df + 0.5) / (df + 0.5) + 1.0 )
        
        # 2. حساب TF في الوثيقة الحالية
        tf = 0
        for doc, term_freq in inverted_index[token]:
            if doc == doc_id:
                tf = term_freq
                break
        
        # 3. حساب الجزء الخاص بالـ Term Frequency في معادلة BM25
        numerator = tf * (k1 + 1)
        denominator = tf + k1 * (1 - b + b * (doc_len / avgdl))
        
        score += idf * (numerator / denominator)
        
    return score

# مثال: البحث عن "ذكاء مستقبل"
query = ["ذكاء", "مستقبل"]
scores = {}
candidate_docs = {1, 2, 3} # كل الوثائق في مثالنا

for doc_id in candidate_docs:
    scores[doc_id] = calculate_bm25_score(query, doc_id)

# scores: {1: 1.38, 2: 0.69, 3: 0.69} (قيم تقريبية)
# نرتب النتائج: doc1, ثم doc2 و doc3
# النتيجة منطقية لأن doc1 يحتوي على الكلمتين معاً وهو قصير نسبياً.

نرتب النتائج ونرجعها: نعرض النتائج للمستخدم مرتبة من الأعلى نقاطاً إلى الأقل.

الخطوة 4: تخزين الفهرس واستخدامه

بناء الفهرس من الصفر مفيد للتعلم، لكن في التطبيقات الحقيقية، لا تعيد اختراع العجلة! استخدم محركات بحث جاهزة وقوية تقوم بكل هذا العمل الشاق وأكثر.

Elasticsearch: هو المعيار الصناعي للمشاريع الكبيرة. قوي جداً، قابل للتوسع، وله مجتمع ضخم. يحتاج لبعض الخبرة لإعداده وإدارته.
Meilisearch: خيار رائع وحديث، يركز على السرعة وسهولة الاستخدام. “شغّل وامشي”. مثالي للمشاريع المتوسطة والصغيرة. إعداده بسيط جداً ويوفر نتائج فورية وتجربة مستخدم ممتازة.
بناء بسيط خاص بك: يمكنك تخزين الفهرس في ملف JSON أو في قاعدة بيانات NoSQL مثل Redis. هذا مناسب للمشاريع الصغيرة جداً أو لأغراض تعليمية، لكنه يفتقر للميزات المتقدمة وقابلية التوسع.

نصيحة من أبو عمر: ابدأ بـ Meilisearch إذا كان مشروعك جديداً أو متوسط الحجم. سهولته وسرعته ستدهشك. إذا كان مشروعك ضخماً جداً ويتطلب تحليلات معقدة، فـ Elasticsearch هو صديقك.

قياس الأداء: قبل وبعد

عندما طبقنا هذا الحل لموقع “أبو خليل”، كانت النتائج مذهلة. دعنا نقارن:

أبو خليل اتصل بي بعد أسبوع وقال لي جملة لن أنساها: “يا أبو عمر، كأنك فتحت باب كان مسكّر! المبيعات زادت والناس مبسوطة”. هذه هي قوة البحث الحقيقي.

خلاصة الكلام والنصيحة الأخيرة 💡

بناء محرك بحث نصي فعال ليس سحراً، بل هو علم وهندسة. المبادئ الأساسية بسيطة وقوية:

ودّع LIKE: إنه ليس أداة بحث، بل أداة لمطابقة الأنماط.
احتضن الفهرس المعكوس: هو مفتاح السرعة الفائقة.
استخدم BM25 للترتيب: هي الخوارزمية التي تضمن ظهور النتائج الأكثر صلة أولاً.
لا تخترع العجلة في الإنتاج: تعلم المبادئ الأساسية، ولكن استخدم أدوات متخصصة مثل Elasticsearch أو Meilisearch لتوفير الوقت والجهد والحصول على أفضل النتائج.

فهمك لهذه المفاهيم سيجعلك مطوراً أفضل، قادراً على بناء أنظمة أذكى وأسرع. لن تكون مجرد مبرمج يكتب الكود، بل مهندساً يحل المشاكل الحقيقية التي تواجه المستخدمين. بالتوفيق يا جماعة! 👍

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

برمجة وقواعد بيانات

من SQL إلى NoSQL: دليل المبرمج الشامل لاختيار قاعدة البيانات المثالية لمشروعك

هل أنت حائر بين SQL و NoSQL؟ هذه المقالة ستساعدك على فهم الفروق الرئيسية بينهما، وتقييم احتياجات مشروعك، واختيار قاعدة البيانات الأنسب لتحقيق النجاح. دليل...

25 ديسمبر، 2025 قراءة المزيد

توسع بلا حدود: كيف ندير التطبيقات العملاقة في 2026 باستخدام الواجهات المصغرة والذكاء الاصطناعي

بودكاست

برمجة وقواعد بيانات

توسع بلا حدود: كيف ندير التطبيقات العملاقة في 2026 باستخدام الواجهات المصغرة والذكاء الاصطناعي

بصفتي أبو عمر، أشارككم رحلتي في ترويض التطبيقات العملاقة. نغوص في بنية الواجهات المصغرة (Micro-Frontends) ونتعلم كيف يحل Module Federation 2.0 مع Rspack مشاكلها، ونستشرف...

12 يناير، 2026 قراءة المزيد

برمجة وقواعد بيانات

الأمن السيبراني للمطورين: دليلي من غزة لتأمين تطبيقاتك ضد الاختراق

في هذه المقالة سأشارككم خلاصة خبرتي في الأمن السيبراني. سنتعلم سوياً عن أشهر البرمجيات الخبيثة والثغرات مثل SQL Injection و XSS، وكيف نحمي تطبيقاتنا بكود...

25 يناير، 2026 قراءة المزيد

بودكاست

برمجة وقواعد بيانات

من SQL إلى NoSQL: دليل المطورين لاختيار قاعدة البيانات الأمثل لمشروعك (قصة حقيقية ونصائح عملية)

هل تحتار في اختيار قاعدة البيانات لمشروعك؟ هذه المقالة تأخذك في رحلة من SQL إلى NoSQL، مع قصة واقعية من مشاريعي، وشرح مبسط ومفيد، ونصائح...

24 ديسمبر، 2025 قراءة المزيد

برمجة وقواعد بيانات

من 30 ثانية إلى 300 ميللي ثانية: كيف أنقذتُ لوحة بيانات حية بفهم خوارزميات B-Tree وBitmap

قصة حقيقية عن كيفية تسريع استعلامات قواعد البيانات العملاقة التي تستغرق ثوانٍ طويلة لتصبح لحظية. نغوص في أعماق خوارزميات الفهرسة مثل B-Tree وBitmap Index، مع...

19 يناير، 2026 قراءة المزيد

برمجة وقواعد بيانات

حكاية من غزة: متى يكون Service Container في Laravel خطأً فادحًا؟

من قلب غزة إلى وادي السيليكون، حكاية تعلمت فيها أن أفضل كود هو أحيانًا أبسط كود. اكتشف معي، أنا أبو عمر، متى يكون استخدام Service...

31 يناير، 2026 قراءة المزيد

برمجة وقواعد بيانات

Node.js في عصر الوكلاء المستقلين: أوركسترا الذكاء الاصطناعي لما بعد الـ Chatbots

اكتشف كيف يتفوق Node.js في إدارة الوكلاء المستقلين بفضل طبيعته اللاتزامنية، وكيف يمكن تحويل وظائف الباك إند إلى "أدوات" ذكية، واستخدام LangGraph.js لبناء وكلاء يتذكرون...

26 ديسمبر، 2025 قراءة المزيد

تطوير الويب فائق السرعة: كيف تبني تطبيقات Full-Stack باستخدام Rust و WebAssembly في 2026

بودكاست

برمجة وقواعد بيانات

تطوير الويب فائق السرعة: كيف تبني تطبيقات Full-Stack باستخدام Rust و WebAssembly في 2026

في عام 2026، لم تعد JavaScript وحدها تكفي. أشارككم تجربتي كـ "أبو عمر" في الانتقال من عالم JavaScript إلى Rust و WebAssembly لبناء تطبيقات ويب...

12 يناير، 2026 قراءة المزيد

برمجة وقواعد بيانات

مراجعتي لإطار عمل Laravel في 2026: هل لا يزال ملك الـPHP في عصر الذكاء الاصطناعي؟

بصفتي أبو عمر، أشارككم مراجعتي الشخصية والتقنية لإطار عمل Laravel في عام 2026. نستكشف معًا نقاط قوته وضعفه، ونقارنه بأطر العمل الأخرى، ونقيّم جاهزيته لموجة...

2 فبراير، 2026 قراءة المزيد

آخر المدونات

ادارة الفرق والتنمية البشرية

فريقي كان يخشى ارتكاب الأخطاء: كيف أنقذني بناء ‘الأمان النفسي’ من جحيم الإبداع المكبوت؟

أنا أبو عمر، مطور برمجيات فلسطيني، وأروي لكم كيف حوّلت فريقي من مجموعة خائفة من ارتكاب الأخطاء إلى فريق مبدع ومنتج. اكتشفوا معي مفهوم "الأمان...

2 أبريل، 2026 قراءة المزيد

اختبارات الاداء والجودة

تحديثاتي كانت تحطم الميزات القديمة: كيف أنقذتني ‘الاختبارات التراجعية الآلية’ من جحيم الخوف عند كل إصدار؟

أشارككم قصتي مع الخوف من تحديث البرمجيات وكيف كانت التحديثات الجديدة تكسر الميزات القديمة دون علمي. اكتشفوا معي كيف أصبحت "الاختبارات التراجعية الآلية" (Automated Regression...

2 أبريل، 2026 قراءة المزيد

أدوات وانتاجية

مراجعات الكود: كيف أنقذني التنسيق التلقائي من جحيم النقاشات الشكلية؟

أشارككم قصة حقيقية عن نقاشات مراجعة الكود التي كادت أن تدمر إنتاجية فريقي، وكيف كانت أدوات التنسيق التلقائي (Linters) هي طوق النجاة. مقالة عملية للمطورين...

2 أبريل، 2026 قراءة المزيد

أتمتة العمليات

مهامي الروتينية كانت تلتهم وقتي: كيف أنقذتني منصات ‘التشغيل الآلي للمهام’ من جحيم العمل اليدوي؟

أنا أبو عمر، مبرمج فلسطيني، وهذه قصتي مع المهام المتكررة التي كادت أن تقتل شغفي بالبرمجة. اكتشف كيف أنقذتني أدوات مثل n8n و Zapier، وحوّلت...

2 أبريل، 2026 قراءة المزيد

نصائح برمجية

بياناتي كانت تتغير خلسة: كيف أنقذني ‘الثبات’ (Immutability) من جحيم الآثار الجانبية؟

أشارككم قصة حقيقية من تجربتي كادت أن تدمر مشروعًا بأكمله بسبب تغييرات خفية في البيانات. اكتشفوا معي مفهوم 'الثبات' (Immutability) وكيف يمكن أن يصبح درعكم...

2 أبريل، 2026 قراءة المزيد

معمارية البرمجيات

تطبيقي المتجانس كان وحشاً لا يمكن ترويضه: كيف أنقذني ‘نمط الخانق’ (Strangler Fig Pattern) من جحيم إعادة الكتابة الكبرى؟

كنتُ غارقاً في تطبيق متجانس ضخم، وكل محاولة لتحديثه كانت كابوساً يهدد استقرار العمل بأكمله. في هذه المقالة، أشارككم قصتي مع هذا "الوحش" وكيف كان...

2 أبريل، 2026 قراءة المزيد

خوارزميات

مساراتي كانت متاهة: كيف أنقذتني خوارزمية ‘ديكسترا’ من جحيم التخطيط العشوائي؟

أشارككم قصة شخصية عن فوضى التخطيط وكيف تحولت إلى نظام بفضل خوارزمية ديكسترا. هذه المقالة دليلكم الشامل لفهم وتطبيق هذه الخوارزمية العبقرية، من المفهوم الأساسي...

2 أبريل، 2026 قراءة المزيد

تسويق رقمي

موقعي كان يعامل الجميع بنفس الطريقة: كيف أنقذني ‘التخصيص الديناميكي للمحتوى’ من جحيم التجارب العامة؟

اسمحوا لي أن أحكي لكم قصة من واقع تجربتي كمبرمج، قصة عن موقع كاد أن يفشل بسبب خطأ بسيط: معاملة كل الزوار بنفس الطريقة. سأشارككم...

2 أبريل، 2026 قراءة المزيد

تجربة المستخدم والابداع البصري

تطبيقي كان يستبعد المستخدمين: كيف أنقذتني إرشادات WCAG من جحيم التصميم الإقصائي؟

كنت أظن أن تطبيقي الجديد تحفة فنية، حتى جاءتني رسالة من مستخدم غيرت كل شيء. هذه قصتي عن كيف اكتشفت أن تصميمي "الرائع" كان يبني...

2 أبريل، 2026 قراءة المزيد

المشكلة: لماذا البحث التقليدي بـ `LIKE` لا يكفي؟

1. بطء قاتل في الأداء

2. نتائج غير مرتبة حسب الصلة

الحل الحقيقي: الفهرس المعكوس وخوارزميات الترتيب

مفهوم الفهرس المعكوس (Inverted Index)

خوارزميات الترتيب: من TF-IDF إلى BM25

مثال عملي: بناء محرك بحث لمدونة تقنية

الخطوة 1: معالجة النصوص (Text Processing)

الخطوة 2: بناء الفهرس المعكوس

الخطوة 3: البحث وحساب النقاط بـ BM25

الخطوة 4: تخزين الفهرس واستخدامه

قياس الأداء: قبل وبعد

خلاصة الكلام والنصيحة الأخيرة 💡

سجل دخولك لعمل نقاش تفاعلي

مراجعة رأيك قبل النشر

آراء من النقاشات

مقالات ذات صلة

آخر المدونات