خوارزميات

بحثي كان أعمى وبطيء: كيف أنقذتني ‘مرشحات بلوم’ (Bloom Filters) من جحيم التحقق المكلف؟

أبو عمر 4 أبريل، 2026 1 دقائق قراءة

“يا زلمة، قاعدة البيانات رح تنفجر!”

أذكرها وكأنها البارحة. كنت أعمل على نظام ضخم لإحدى الشركات، وكان أحد أجزاء النظام يسمح للمستخدمين باختيار “اسم مستخدم” فريد. الفكرة بسيطة، أليس كذلك؟ كلما كتب المستخدم حرفًا، نتحقق في الخلفية إذا كان الاسم متاحًا أم لا. في البداية، ومع عدد مستخدمين قليل، كانت الأمور “عال العال”. استعلام SQL بسيط: SELECT 1 FROM users WHERE username = ?. سريع، نظيف، ويؤدي الغرض.

لكن الكارثة بدأت عندما تخطى عدد المستخدمين حاجز المليون، ثم المليونين، ثم الخمسة. فجأة، تحول هذا الاستعلام البريء إلى وحش يلتهم موارد قاعدة البيانات. مع آلاف المستخدمين الذين يجرّبون أسماءً جديدة في نفس اللحظة، أصبحت قاعدة البيانات تقضي 90% من وقتها في الإجابة على سؤال واحد: “هل هذا الاسم موجود؟”. أصبح النظام بطيئًا، وتجربة المستخدم في الحضيض، ووصلتني رسالة من مدير النظام نصها: “أبو عمر، يا زلمة، قاعدة البيانات رح تنفجر! لازم تلاقي حل!”.

في تلك اللحظة من اليأس، وأنا أقلّب في دفاتر ملاحظاتي القديمة وأبحث في ذاكرتي المبعثرة، لمعت في ذهني فكرة كنت قد قرأت عنها في كتاب خوارزميات قديم: مرشحات بلوم (Bloom Filters). كانت تلك اللحظة بمثابة العثور على خريطة كنز في وسط الصحراء. لم تكن مجرد حل، بل كانت الحل الأمثل الذي أنقذ المشروع بأكمله.

ما هي “مرشحات بلوم” هذه التي أنقذت الموقف؟

دعوني أبسّط لكم الفكرة. تخيل أنك حارس أمن على باب حفلة ضخمة جدًا. بدلًا من أن تحمل قائمة ورقية بأسماء كل المدعوين (وهو أمر بطيء ومستهلك للوقت)، لديك طريقة سحرية وسريعة.

مرشح بلوم هو هيكل بيانات احتمالي (Probabilistic Data Structure) فائق الكفاءة من حيث المساحة، ومصمم ليجيب على سؤال واحد بسرعة البرق: “هل هذا العنصر عضو في هذه المجموعة؟”.

لكن هنا تكمن الخدعة الذكية: إجابته ليست دائمًا “نعم” أو “لا” بشكل قاطع. إجاباته هي:

“لا، هذا العنصر بالتأكيد ليس في المجموعة.” (إجابة مؤكدة 100%)
“نعم، هذا العنصر ربما يكون في المجموعة.” (إجابة محتملة، قد تكون خاطئة أحيانًا)

قد يبدو هذا غريبًا، لماذا أريد إجابة “ربما”؟ لأن هذا الـ “ربما” هو سر قوتها. هي لا تعطيك أبدًا نتيجة “سلبية خاطئة” (False Negative). أي أنها لن تخبرك أبدًا أن عنصرًا موجودًا هو “غير موجود”. لكنها قد تعطيك نتيجة “إيجابية خاطئة” (False Positive)، أي تخبرك أن عنصرًا غير موجود هو “ربما موجود”.

كيف يعمل هذا السحر من الداخل؟

الأمر أبسط مما تتخيل. يتكون مرشح بلوم من مكونين أساسيين:

مصفوفة بتات (Bit Array): تخيلها سلسلة طويلة جدًا من الأصفار، مثل [0, 0, 0, 0, 0, 0, 0, 0, ...].
عدد (k) من دوال التجزئة (Hash Functions): وهي دوال رياضية تأخذ أي مُدخل (مثل اسم المستخدم) وتحوله إلى رقم فريد يمثل موضعًا (index) في مصفوفة البتات.

1. عملية الإضافة (Adding an Item)

عندما نريد إضافة عنصر جديد (مثل اسم المستخدم “abu_omar”) إلى المرشح:

نمرر الاسم “abu_omar” على كل دالة من دوال التجزئة (لنفترض أن لدينا 3 دوال).
الدالة الأولى تعطينا الرقم 2.
الدالة الثانية تعطينا الرقم 5.
الدالة الثالثة تعطينا الرقم 9.
نذهب إلى مصفوفة البتات ونغير قيمة الخانات رقم 2 و 5 و 9 من 0 إلى 1.

هذا كل شيء! لقد أضفنا العنصر.

2. عملية التحقق (Checking for an Item)

الآن، عندما يأتي مستخدم جديد ويحاول تسجيل اسم “new_user”:

نمرر الاسم “new_user” على نفس دوال التجزئة الثلاث.
لنفترض أنها أعطتنا الأرقام 3، 6، و 10.
نذهب ونتفحص الخانات 3، 6، و 10 في مصفوفة البتات.
إذا وجدنا واحدة على الأقل من هذه الخانات قيمتها 0، فهذا يعني أن هذا العنصر بالتأكيد لم تتم إضافته من قبل. ونرجع بنتيجة “غير موجود” بكل ثقة.
أما إذا وجدنا أن كل الخانات (3، 6، و 10) قيمتها 1، فهنا نقول: “هذا العنصر ربما يكون موجودًا“.

لماذا “ربما”؟ لأنه من المحتمل أن تكون هذه الخانات قد تحولت إلى 1 بسبب إضافة عناصر أخرى مختلفة تمامًا تصادف أن دوال التجزئة الخاصة بها أشارت إلى نفس هذه المواضع. هذا هو ما يسمى بـ “الإيجابية الخاطئة” (False Positive).

التطبيق العملي: العودة إلى قصة “جحيم التحقق”

الآن، لنعد إلى مشكلتي مع قاعدة البيانات. إليكم كيف طبقت مرشح بلوم لحل المشكلة:

عند بدء تشغيل الخادم، قمت ببناء مرشح بلوم في الذاكرة (In-memory) يحتوي على كل أسماء المستخدمين الموجودة في قاعدة البيانات. هذه العملية تتم مرة واحدة فقط وتستغرق بضع ثوانٍ أو دقائق حسب حجم البيانات.
عندما يحاول مستخدم جديد اختيار اسم، هذا هو التدفق الجديد:
- الخطوة الأولى (فحص المرشح): يتم فحص الاسم المقترح مقابل مرشح بلوم الموجود في الذاكرة. هذه العملية سريعة جدًا لأنها لا تتضمن أي اتصال بالشبكة أو قراءة من القرص الصلب.
- الحالة (أ): إذا قال المرشح “بالتأكيد غير موجود”، نعرض للمستخدم فورًا أن الاسم متاح. وبهذا نكون قد تجنبنا استعلام قاعدة البيانات المكلف!
- الحالة (ب): إذا قال المرشح “ربما موجود”، فقط في هذه الحالة، نقوم بتنفيذ استعلام SQL للتحقق من قاعدة البيانات بشكل قاطع.

النتيجة كانت مذهلة. إذا كانت نسبة الإيجابيات الخاطئة في المرشح 1% فقط، فهذا يعني أننا نجحنا في التخلص من 99% من استعلامات التحقق غير الضرورية التي كانت تضغط على قاعدة البيانات. لقد تحرر النظام، وعادت السرعة، وشربت فنجان قهوة وأنا أبتسم. ☕

مثال بالكود (Python)

لتقريب الصورة، هذا مثال عملي باستخدام مكتبة pybloom_live في بايثون:


from pybloom_live import BloomFilter
import time

# في تطبيق حقيقي، هذه القائمة تأتي من قاعدة البيانات
existing_usernames = ["abu_omar", "sami", "layla", "user12345", "dev_guru"]

# 1. بناء المرشح
# نهيئ المرشح لـ 100 ألف عنصر مع نسبة خطأ 1%
# المكتبة تختار حجم المصفوفة وعدد دوال التجزئة تلقائيًا
user_bloom_filter = BloomFilter(capacity=100000, error_rate=0.01)

print("بدء بناء مرشح بلوم من قاعدة البيانات...")
for user in existing_usernames:
    user_bloom_filter.add(user)
print("اكتمل بناء المرشح.")

# دالة وهمية لمحاكاة التحقق من قاعدة البيانات
def check_db(username):
    print(f"  -> [قاعدة البيانات]: يتم الآن التحقق من '{username}'...")
    time.sleep(0.1) # محاكاة بطء قاعدة البيانات
    if username in existing_usernames:
        return False # غير متاح
    return True # متاح

# 2. دالة التحقق الجديدة
def is_username_available(username):
    print(f"nالتحقق من الاسم: '{username}'")
    
    # الخطوة الأولى: التحقق من المرشح (سريع جدًا)
    if username not in user_bloom_filter:
        print(f"  => [المرشح]: '{username}' بالتأكيد غير موجود. لا حاجة للتحقق من قاعدة البيانات.")
        return True
    else:
        # الخطوة الثانية: المرشح يقول "ربما". الآن فقط نتحقق من قاعدة البيانات
        print(f"  => [المرشح]: '{username}' ربما يكون موجودًا. يجب التحقق من قاعدة البيانات للتأكيد.")
        is_available = check_db(username)
        if not is_available:
             print(f"  -> [قاعدة البيانات]: أكدت أن '{username}' محجوز.")
        else:
             print(f"  -> [قاعدة البيانات]: الاسم '{username}' متاح. (كانت نتيجة المرشح إيجابية خاطئة).")
        return is_available

# --- التجربة ---
is_username_available("a_totally_new_user") # سيتم حله بسرعة بواسطة المرشح
is_username_available("abu_omar") # سيحتاج إلى التحقق من قاعدة البيانات

نصائح من خبرة أبو عمر

متى تستخدم مرشحات بلوم؟ استخدمها كـ “طبقة أولى” من الدفاع قبل الوصول إلى مورد مكلف (قاعدة بيانات، واجهة برمجة تطبيقات خارجية، نظام ملفات). هي ممتازة في أنظمة التخزين المؤقت (Caching) لتجنب جلب بيانات غير موجودة، وفي أنظمة الأمان لحجب قوائم ضخمة من المواقع الضارة، وفي قواعد البيانات الموزعة لمعرفة أي “عقدة” (node) قد تحتوي على البيانات.
متى لا تستخدمها؟ لا تستخدمها أبدًا إذا كنت لا تستطيع تحمل أي نسبة من الإيجابيات الخاطئة (False Positives). على سبيل المثال، في نظام بنكي للتحقق من وجود حساب، نتيجة “ربما” غير مقبولة على الإطلاق.
لا يمكن الحذف: مرشح بلوم القياسي لا يدعم حذف العناصر. بمجرد أن يتحول البت إلى 1، فإنه يبقى 1. إذا كنت بحاجة إلى الحذف، فابحث عن متغيرات أخرى مثل “مرشحات بلوم العدّادة” (Counting Bloom Filters)، ولكنها تستهلك مساحة أكبر.
الموازنة هي المفتاح: عند تهيئة المرشح، أنت توازن بين حجم الذاكرة ومعدل الخطأ. معدل خطأ أقل يعني ذاكرة أكبر. لحسن الحظ، معظم المكتبات الحديثة تجعل هذه العملية سهلة، حيث تطلب منك فقط السعة المتوقعة ومعدل الخطأ المرغوب.

الخلاصة: السلاح السري في جعبتك 🎯

مرشحات بلوم هي مثال رائع على كيف يمكن لفكرة خوارزمية بسيطة وذكية أن تحل مشاكل أداء معقدة. هي ليست حلًا لكل شيء، ولكن في السيناريوهات الصحيحة، هي بمثابة سلاح سري يوفر عليك الكثير من الموارد والصداع.

الدرس الأكبر الذي تعلمته من تلك التجربة هو ألا نحصر تفكيرنا في الحلول التقليدية فقط. في بعض الأحيان، البحث “خارج الصندوق” في عالم هياكل البيانات والخوارزميات يمكن أن يقودنا إلى حلول أكثر أناقة وفعالية. لا تخف من الخوارزميات، بل اجعلها صديقتك وأداة قوية في ترسانتك البرمجية.

يلا، شدوا حيلكم، ودائمًا فكروا بذكاء قبل أن تكتبوا الكود! 💪

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

بودكاست

خوارزميات

من الاختناق إلى الانسيابية: تجربتي في ترويض تدفق البيانات بخوارزميات تقنين المعدل

في هذا المقال، أشارككم تجربتي العملية مع خوارزميات تقنين المعدل (Rate Limiting)، وكيف ساهمت في حماية الأنظمة من الانهيار تحت الضغط الهائل للطلبات. سنتناول خوارزميات...

29 ديسمبر، 2025 قراءة المزيد

خوارزميات

التجزئة المتسقة (Consistent Hashing): الخوارزمية التي أنقذتنا من فوضى توسيع الخوادم

أتذكر جيداً ذلك اليوم الذي كاد أن ينهار فيه كل شيء بسبب إضافة خادم جديد. في هذه المقالة، أشارككم قصة حقيقية عن كيفية انتقالنا من...

6 مايو، 2026 قراءة المزيد

خوارزميات

كان التحقق من وجود البيانات يقتل قاعدة بياناتنا: كيف أنقذنا ‘فلتر بلوم’ (Bloom Filter) من جحيم الاستعلامات غير الضرورية؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف أنقذتنا خوارزمية بسيطة وعبقرية تُدعى "فلتر بلوم" من انهيار قاعدة بياناتنا تحت وطأة استعلامات التحقق. سنتعمق في...

12 مايو، 2026 قراءة المزيد

خوارزميات

الذاكرة مقابل الدقة: كيف أنقذتنا مرشحات بلوم (Bloom Filters) من جحيم التحقق من التفرد في البيانات الضخمة؟

أنا أبو عمر، وفي هذه المقالة سأشارككم قصة من الميدان عن معاناتنا مع التحقق من البيانات في الأنظمة الضخمة، وكيف كانت هياكل البيانات الاحتمالية، وتحديداً...

17 مايو، 2026 قراءة المزيد

خوارزميات

كانت تبعيات مهامنا كابوساً لا ينتهي: كيف أنقذنا ‘الفرز الطوبولوجي’ من جحيم التنفيذ العشوائي؟

أذكر جيداً تلك الأيام التي كانت فيها فوضى تنفيذ المهام المترابطة تهدد بإغراق مشروعنا. في هذه المقالة، أشارككم كيف كانت خوارزمية 'الفرز الطوبولوجي' هي طوق...

30 أبريل، 2026 قراءة المزيد

خوارزميات

الفرز الطوبولوجي: كيف أنقذنا مهامنا من جحيم الاعتماديات الدائرية؟

في أحد المشاريع، وجدنا أنفسنا في حلقة مفرغة؛ المهام تنتظر بعضها إلى ما لا نهاية. أشارككم في هذه المقالة قصة كيف أنقذتنا خوارزمية "الفرز الطوبولوجي"...

16 مايو، 2026 قراءة المزيد

خوارزميات

كانت قاعدة بياناتنا تستجدي الرحمة: كيف أنقذنا ‘مرشح بلوم’ (Bloom Filter) من جحيم التحقق؟

أشارككم قصة حقيقية من خنادق البرمجة، عندما كانت قاعدة بياناتنا على وشك الانهيار بسبب عمليات التحقق المتكررة. سأشرح لكم كيف كانت خوارزمية بسيطة وذكية مثل...

28 مايو، 2026 قراءة المزيد

خوارزميات

مساراتنا كانت عشوائية ومكلفة: كيف أنقذتنا خوارزمية A* من جحيم البحث الأعمى؟

أشارككم قصة من قلب المعركة البرمجية، كيف انتقلنا من البحث العشوائي المُكلف في مشاريعنا إلى الكفاءة والدقة. هذه المقالة تشرح خوارزمية A* بالتفصيل، من الفكرة...

9 أبريل، 2026 قراءة المزيد

خوارزميات

كان البحث عن ‘الشبيه’ في بياناتنا مثل البحث عن إبرة في الكون: كيف أنقذتنا ‘التجزئة الحساسة للموقع’ (LSH) من جحيم المقارنات الكاملة؟

في هذه المقالة، أشارككم قصة حقيقية من معركتنا مع البيانات الضخمة وكيف كانت خوارزمية التجزئة الحساسة للموقع (LSH) هي طوق النجاة. سنغوص في تفاصيل هذه...

22 مايو، 2026 قراءة المزيد

آخر المدونات

برمجة وقواعد بيانات

تحديثات قاعدة البيانات بدون توقف: كيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من جحيم التوقفات المجدولة؟

هل سئمت من إيقاف الخدمة مع كل تحديث لهيكلة قاعدة البيانات؟ أشارككم قصة حقيقية وكيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من ليالي النشر الطويلة والمُجهدة،...

4 يونيو، 2026 قراءة المزيد

الشبكات والـ APIs

كانت إعادة المحاولة كارثة: كيف أنقذتنا مفاتيح عدم تكرار العمليات (Idempotency Keys) من جحيم الفواتير المزدوجة؟

أشارككم قصة حقيقية من الخنادق البرمجية، يوم كاد خطأ بسيط في إعادة محاولة طلبات الدفع أن يكلفنا سمعتنا وأموال عملائنا. اكتشفوا معنا كيف كانت مفاتيح...

4 يونيو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

كانت مهمتي البرمجية للاختبار مجرد كود: كيف أنقذني توثيق القرارات من جحيم الصمت بعد المقابلة؟

أشارككم قصة حقيقية من بداياتي، وكيف تعلمت بالطريقة الصعبة أن المهمة البرمجية ليست مجرد كتابة كود، بل هي فرصة لإظهار طريقة تفكيرك. اكتشف كيف يمكن...

4 يونيو، 2026 قراءة المزيد

التوسع والأداء العالي والأحمال

نمط قاطع الدائرة: كيف نجا نظامنا من جحيم الانهيارات المتسلسلة؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف تحول فشل بسيط في إحدى الخدمات إلى انهيار كارثي للنظام بأكمله. واكتشفوا معنا نمط "قاطع الدائرة" (Circuit...

4 يونيو، 2026 قراءة المزيد