خوارزميات

قواعد بياناتنا كانت تستغيث: كيف أنقذ “فلتر بلوم” نظامنا من جحيم الاستعلامات؟

أبو عمر 16 أبريل، 2026 2 دقائق قراءة

يا أهلاً وسهلاً فيكم يا جماعة. قبل ما نبدأ في التفاصيل التقنية المعقدة، خليني أحكيلكم قصة صارت معي ومع فريقي قبل فترة، قصة فنجان قهوة وداتابيز كانت على وشك الانهيار.

كنا شغالين على نظام فيه ميزة تسجيل مستخدمين جديدة، وكل مستخدم لازم يختار اسم فريد. في البداية، الأمور كانت “عال العال”. لكن مع زيادة شعبية التطبيق، بدأت تظهر مشكلة غريبة. لوحات المراقبة (Dashboards) تبعتنا صارت تضوي بالأحمر، ومعالج قاعدة البيانات (CPU) واصل للسما، والتطبيق صار بطيء زي السلحفاة. قعدنا ندوّر ونحلل، شو القصة يا جماعة؟

بعد ليلة طويلة من التحليل وتفريغ سجلات الأخطاء (logs)، اكتشفنا المصيبة: عدد هائل من الطلبات بتوصلنا للتحقق من أسماء مستخدمين… غير موجودة أصلاً! آلاف الطلبات في الثانية الواحدة تسأل: “هل الاسم xpto123 موجود؟”، “هل الاسم qwerty987 موجود؟”. كل طلب من هدول كان يروح على قاعدة البيانات، يعمل استعلام (query) مكلف، ويرجع بجواب “لا، غير موجود”. قاعدة البيانات كانت بتصيّح وبتقول: “ارحموني!”. كانت تستنزف مواردها في الإجابة بـ”لأ”.

هنا، وأنا ماسك فنجان القهوة الثالث وعيوني حوّلت، تذكرت محاضرة قديمة في الجامعة عن “هياكل البيانات الاحتمالية”. لمعت في بالي كلمة: فلتر بلوم (Bloom Filter). كانت هي طوق النجاة اللي أنقذنا من هذا الجحيم.

ما هو “فلتر بلوم” يا أبو عمر؟

ببساطة شديدة، فلتر بلوم هو هيكل بيانات احتمالي (probabilistic data structure) فائق السرعة والكفاءة من ناحية المساحة التخزينية. وظيفته الأساسية هي إجابتك على سؤال واحد فقط: “هل هذا العنصر قد يكون موجوداً في المجموعة؟”.

لاحظوا إني قلت “قد يكون”. هنا يكمن سحره وقيده في نفس الوقت.

الفكرة ببساطة.. كأنك حارس على باب

تخيل أنك حارس أمن (Bouncer) على باب حفلة كبيرة. بدل ما يكون معك قائمة ورقية طويلة بأسماء كل المدعوين، معك طريقة أذكى:

لما يجي ضيف مدعو، بتاخذ اسمه وبتعمل عليه “ختم غير مرئي” خاص فيك على إيدك.
لما يجي شخص جديد ويسأل إذا هو مدعو، بتطلب منه يورجيك إيده. إذا ما عليها أي ختم، بتقوله بكل ثقة: “أنت بالتأكيد لست مدعواً. ممنوع الدخول”.
إذا كان على إيده ختم، بتقوله: “أهلاً، تفضل، لكن اذهب إلى مكتب الاستقبال في الداخل للتأكد من اسمك”.

فلتر بلوم هو هذا الحارس الذكي. هو يستطيع أن يقول بشكل قاطع 100% أن العنصر غير موجود (وهذا ما نحتاجه!). ولكنه عندما يقول أن العنصر موجود، فهناك احتمال صغير أن يكون مخطئاً (وهو ما يسمى بالإيجابية الكاذبة أو False Positive). لكنه أبداً لا يخطئ في الاتجاه الآخر (لا يوجد شيء اسمه سلبية كاذبة False Negative). إذا قال لك “غير موجود”، فهو حتماً غير موجود.

طيب، كيف بيشتغل هالسحر؟

الآلية الداخلية لفلتر بلوم مبنية على فكرتين بسيطتين: مصفوفة من البتات (Bit Array) ومجموعة من دوال التجزئة (Hash Functions).

المكونات الأساسية

مصفوفة بتات (Bit Array): تخيلها كمصفوفة طويلة جداً من الأصفار، مثلاً `[0, 0, 0, 0, 0, 0, 0, 0, …]`. حجم هذه المصفوفة هو أحد العوامل التي نتحكم بها.
عدة دوال تجزئة (k Hash Functions): نحتاج إلى عدد `k` من دوال الهاش المختلفة والمستقلة عن بعضها. هذه الدوال تأخذ أي مدخل (مثل اسم المستخدم) وتحوله إلى رقم (إلى مؤشر داخل مصفوفتنا).

عملية الإضافة (Add)

لإضافة عنصر جديد (مثلاً، اسم المستخدم “omar”) إلى الفلتر، نقوم بالخطوات التالية:

نمرر الاسم “omar” على كل دوال الهاش الـ `k` (لنفترض أن `k=3`).
كل دالة هاش ستعطينا مؤشراً (index) مختلفاً داخل مصفوفة البتات. مثلاً:
- hash1("omar") -> يعطينا المؤشر 2
- hash2("omar") -> يعطينا المؤشر 5
- hash3("omar") -> يعطينا المؤشر 9
نذهب إلى هذه المؤشرات في مصفوفة البتات ونغير قيمتها من 0 إلى 1.

بعد إضافة “omar”، ستبدو مصفوفتنا هكذا (بشكل مبسط): `[0, 0, 1, 0, 0, 1, 0, 0, 0, 1, …]`.

عملية التحقق (Check)

الآن، عندما يأتي طلب للتحقق من وجود اسم مستخدم جديد، مثلاً “ahmad”، نقوم بنفس العملية:

نمرر “ahmad” على نفس دوال الهاش الثلاثة.
ستعطينا مؤشرات جديدة، مثلاً: 1، 4، و 8.
نذهب ونتحقق من القيم في هذه المؤشرات في مصفوفة البتات. سنجد أن `array[1]=0`، `array[4]=0`، `array[8]=0`.
بما أننا وجدنا على الأقل قيمة واحدة تساوي صفر، نستنتج بشكل قاطع ومؤكد 100% أن “ahmad” لم تتم إضافته من قبل. وهنا نرفض الطلب مباشرة دون أن نلمس قاعدة البيانات.

ماذا لو تحققنا من “omar” مرة أخرى؟ سنقوم بتمريره على دوال الهاش، وسنحصل على نفس المؤشرات 2, 5, 9. سنتحقق من القيم فنجد أن `array[2]=1`، `array[5]=1`، و `array[9]=1`. بما أن كل القيم كانت 1، فإن الفلتر يقول: “هذا العنصر قد يكون موجوداً”. عند هذه النقطة فقط، نسمح للطلب بالمرور إلى قاعدة البيانات للتحقق النهائي.

لغز الإيجابيات الكاذبة (False Positives)

قد تسأل، “طيب يا أبو عمر، من أين تأتي الإيجابية الكاذبة؟”. الجواب هو من تصادمات الهاش (Hash Collisions). تخيل أننا أضفنا “omar” (الذي ضبط المؤشرات 2, 5, 9) ثم أضفنا “sami” (الذي ضبط المؤشرات 1, 4, 7) ثم أضفنا “leila” (التي ضبطت المؤشرات 3, 6, 8). الآن، لو أتى مستخدم جديد لم نسجله من قبل، وليكن اسمه “zain”، وبالصدفة البحتة، أعطتنا دوال الهاش لـ “zain” المؤشرات 2، 4، و 8. عندما نتحقق من هذه المؤشرات، سنجد أن `array[2]` تم ضبطه بواسطة “omar”، و `array[4]` تم ضبطه بواسطة “sami”، و `array[8]` تم ضبطه بواسطة “leila”. النتيجة؟ كل المؤشرات تساوي 1! سيقول الفلتر أن “zain” قد يكون موجوداً (وهو ليس كذلك)، وهذا هو الإيجابي الكاذب. سيذهب هذا الطلب اليتيم إلى قاعدة البيانات، التي ستخبرنا أنه غير موجود. لكننا نكون قد منعنا آلاف الطلبات الأخرى من الوصول إليها.

نصيحة من خبرتي: جمال فلتر بلوم هو أنه يمكنك التحكم في نسبة الخطأ. بزيادة حجم مصفوفة البتات (m) واستخدام العدد الأمثل من دوال الهاش (k)، يمكنك تقليل احتمالية الإيجابيات الكاذبة إلى نسبة ضئيلة جداً (مثلاً 0.01%) مقابل زيادة بسيطة في الذاكرة. هناك حاسبات جاهزة على الإنترنت تساعدك في تحديد هذه القيم بناءً على عدد العناصر المتوقع ونسبة الخطأ المقبولة.

خلّينا نطبّق عملي: مثال كود

الكلام النظري جميل، لكن دعونا نرى كيف يمكن تطبيق هذا عملياً. سنستخدم لغة بايثون ومكتبة `pybloom_live` لتسهيل الأمر.

استخدام مكتبة جاهزة (باستخدام Python)

أولاً، قم بتثبيت المكتبة:

pip install pybloom-live

الآن، لنكتب الكود الذي يحاكي مشكلتنا:


from pybloom_live import BloomFilter

# لنفترض أن لدينا 100,000 مستخدم مسجل
# ونريد نسبة خطأ لا تتجاوز 0.1% (أو 0.001)
# المكتبة ستحسب لنا حجم الفلتر وعدد دوال الهاش تلقائياً
user_filter = BloomFilter(capacity=100000, error_rate=0.001)

# قائمة ببعض المستخدمين المسجلين فعلاً في قاعدة البيانات
registered_users = ["abu_omar", "falasteen_dev", "algorithm_master", "sara_js"]

# لنقم بإضافة هؤلاء المستخدمين إلى فلتر بلوم
print("Adding registered users to the Bloom Filter...")
for user in registered_users:
    user_filter.add(user)
    print(f"- Added '{user}'")

print("\n--- Testing usernames ---")

# --- الحالة الأولى: التحقق من اسم مستخدم موجود ---
username_to_check = "abu_omar"
if username_to_check in user_filter:
    print(f"'{username_to_check}' MIGHT be in the set. Let's check the database.")
    # هنا يتم تنفيذ الاستعلام الفعلي من قاعدة البيانات
else:
    # هذا الجزء لن يتم تنفيذه أبداً للمستخدمين الموجودين
    print(f"'{username_to_check}' is DEFINITELY NOT in the set. Reject request.")

# --- الحالة الثانية: التحقق من اسم مستخدم غير موجود قطعاً ---
username_to_check = "random_user_12345"
if username_to_check in user_filter:
    # هذا يمثل حالة الإيجابية الكاذبة (نادرة جداً)
    print(f"'{username_to_check}' MIGHT be in the set (False Positive!). Let's check the database.")
else:
    # هذا هو السيناريو الأكثر شيوعاً للأسماء غير الموجودة
    print(f"'{username_to_check}' is DEFINITELY NOT in the set. Reject request. (Saved a DB query!)")

# --- الحالة الثالثة: إظهار حالة إيجابية كاذبة (للتوضيح فقط) ---
# سنبحث عن عنصر لم نضفه، لكن قد تتصادم دوال الهاش الخاصة به
# هذا نادر الحدوث في فلتر حقيقي ومضبوط جيداً
false_positive_candidate = "i_might_collide" 
if false_positive_candidate in user_filter:
    print(f"'{false_positive_candidate}' MIGHT be in the set (This is likely a False Positive).")

في حالتنا الواقعية، وضعنا هذا الفلتر كطبقة وسطى (Middleware). أي طلب للتحقق من اسم مستخدم يمر أولاً عبر الفلتر. إذا قال الفلتر “قطعاً غير موجود”، نرجع للمستخدم رسالة “الاسم متاح” فوراً. إذا قال “قد يكون موجوداً”، عندها فقط نرسل الاستعلام إلى قاعدة البيانات. النتيجة؟ انخفاض ضغط قاعدة البيانات بنسبة تجاوزت 90%!

نصيحة من الخبير: متى تستخدم فلتر بلوم؟ ومتى تهرب منه؟

فلتر بلوم ليس حلاً لكل المشاكل، ولكنه أداة سحرية في الحالات الصحيحة.

حالات استخدام مثالية

فحص العناصر في القوائم السوداء (Blacklists): مثلما تفعل متصفحات الويب لفحص الروابط الخبيثة. هل هذا الرابط في قائمة ملايين الروابط الضارة؟ الفلتر يجيب بسرعة “لا” لمعظم الروابط السليمة.
تجنب التكرار: أنظمة التوصية (Recommendation Engines) تستخدمه لتجنب عرض نفس المقال أو المنتج على المستخدم مرتين.

– مشكلتنا بالضبط: التحقق من توفر اسم مستخدم، بريد إلكتروني، أو أي معرف فريد آخر قبل ضرب قاعدة البيانات.

التخزين المؤقت السلبي (Negative Caching): تخزين العناصر “غير الموجودة” في الذاكرة لتجنب البحث عنها مراراً وتكراراً في قاعدة البيانات أو الخدمات الخارجية.

متى لا يكون فلتر بلوم هو الحل

عندما لا تحتمل الإيجابيات الكاذبة إطلاقاً: إذا كان الخطأ الصغير سيسبب كارثة (مثلاً، في نظام مالي حساس)، ابتعد عن فلتر بلوم.
عندما تحتاج إلى حذف العناصر: فلتر بلوم القياسي لا يدعم الحذف. بمجرد أن يصبح البت 1، لا يمكن إعادته إلى 0، لأنك لا تعرف أي عنصر آخر قد يعتمد على هذا البت. (ملاحظة: هناك أنواع متقدمة مثل Counting Bloom Filter تسمح بالحذف ولكنها أكثر تعقيداً وتستهلك ذاكرة أكبر).
عندما تحتاج إلى استرداد العنصر نفسه: فلتر بلوم لا يخزن العناصر، بل “بصماتها” فقط. لا يمكنك استخدامه كقاعدة بيانات.

الخلاصة: فلتر صغير بتأثير كبير 🚀

في عالم تطوير البرمجيات، ليست دائماً الحلول الأكبر والأكثر تعقيداً هي الأفضل. أحياناً، خوارزمية بسيطة وذكية مثل فلتر بلوم يمكن أن تكون الفارق بين نظام ينهار تحت الضغط ونظام يعمل بسلاسة وكفاءة.

لقد علمنا هذا الدرس بالطريقة الصعبة، ولكنه كان درساً قيماً. تعلمنا أن نفكر خارج الصندوق وأن هياكل البيانات الاحتمالية ليست مجرد مواضيع أكاديمية، بل هي أدوات عملية قوية في جعبتنا كمطورين.

نصيحتي الأخيرة لكم: في المرة القادمة التي تواجهون فيها مشكلة تتعلق بالاستعلام عن وجود شيء ما بكثرة، خاصة إذا كانت معظم الإجابات “لا”، تذكروا قصة أبو عمر وفلتر بلوم. قد يكون هو المفتاح الذي تبحثون عنه.

يلا، شدوا حيلكم، وخلينا نشوف تطبيقاتكم الإبداعية لهذه الفكرة! بالتوفيق.

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

خوارزميات

كانت خرائطنا تضلل المستخدمين: كيف أنقذتنا خوارزمية A* من جحيم المسارات غير المنطقية؟

أشارككم قصة حقيقية عن معاناة فريقنا مع تطبيق خرائط كان يرسم مسارات كارثية، وكيف كانت خوارزمية A* هي طوق النجاة الذي غيّر كل شيء. هذه...

1 مايو، 2026 قراءة المزيد

خوارزميات

كانت إضافة سيرفر جديد تمحو ذاكرتنا المؤقتة: كيف أنقذنا ‘التجزئة المتسقة’ (Consistent Hashing) من جحيم الـ Cache Stampede؟

في خضم أزمة أداء خانقة، اكتشفنا أن حلنا السريع بإضافة خادم جديد كان هو سبب المشكلة، وليس حلها. هذه قصتي مع "جحيم الـ Cache Stampede"،...

31 مايو، 2026 قراءة المزيد

خوارزميات

من شوارع فلسطين إلى عالم الخوارزميات: دليلك العملي لحل مشكلة مسارات التوصيل مع Dijkstra و A*

في هذه المقالة، أشارككم خبرتي كمبرمج فلسطيني في حل واحدة من أعقد المشاكل اللوجستية: إيجاد أقصر وأسرع المسارات. سنغوص في عالم الخرائط البيانية (Graphs)، ونتعلم...

23 يناير، 2026 قراءة المزيد

خوارزميات

حساباتنا كانت تعيد اختراع العجلة: كيف أنقذتنا ‘البرمجة الديناميكية’ من جحيم التكرار الحاسوبي؟

أشارككم قصة من قلب المعركة البرمجية، كيف كاد التكرار أن يقتل أداء نظامنا، وكيف ظهرت "البرمجة الديناميكية" كالمنقذ. في هذه المقالة، سنغوص في هذا المفهوم...

24 أبريل، 2026 قراءة المزيد

خوارزميات

البحث عن أقرب جار: كيف أنقذتنا ‘أشجار كيه دي’ (k-d Trees) من جحيم البحث الخطي؟

أتذكر جيداً ذلك المشروع الذي كاد أن يقتلنا ببطئه، حيث كان البحث عن "أقرب جار" في بياناتنا يستغرق دهراً. في هذه المقالة، سأروي لكم كيف...

20 مايو، 2026 قراءة المزيد

خوارزميات

كنا نحرق الذاكرة لحساب المستخدمين الفريدين: كيف أنقذتنا خوارزمية HyperLogLog من جحيم استهلاك الموارد؟

أشارككم قصة حقيقية من الميدان، عندما كادت خوادمنا أن تنهار بسبب عد المستخدمين بالطريقة الساذجة. اكتشفوا معنا خوارزمية HyperLogLog السحرية التي وفرت 99% من الذاكرة...

27 أبريل، 2026 قراءة المزيد

خوارزميات

جداول التجزئة (Hash Tables): كيف أنقذتنا من جحيم البحث عن إبرة في كومة قش؟

أشارككم قصة حقيقية من ميدان البرمجة، كيف كنا نغرق في بحر من البيانات البطيئة، وكيف كانت "جداول التجزئة" طوق النجاة الذي حوّل البحث من عملية...

13 أبريل، 2026 قراءة المزيد

خوارزميات

كانت ذاكرتنا تنفجر: كيف أنقذنا ‘مرشح بلوم’ (Bloom Filter) من جحيم التحقق من العناصر المكررة؟

في إحدى الليالي الطويلة، كادت خوادمنا أن تنهار بسبب التحقق من العناصر المكررة. في هذه المقالة، أسرد لكم قصة كيف أنقذتنا خوارزمية بسيطة وذكية، مرشح...

28 أبريل، 2026 قراءة المزيد

خوارزميات

كانت خرائطنا تضيع في المتاهة: كيف أنقذتنا خوارزمية A* من جحيم المسارات غير الفعالة؟

أشارككم قصة من قلب المعركة البرمجية، يوم كادت طائراتنا المسيّرة أن تضل طريقها للأبد. تعالوا نكتشف معًا كيف كانت خوارزمية A* هي المنقذ، وكيف يمكن...

15 مايو، 2026 قراءة المزيد

آخر المدونات

برمجة وقواعد بيانات

تحديثات قاعدة البيانات بدون توقف: كيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من جحيم التوقفات المجدولة؟

هل سئمت من إيقاف الخدمة مع كل تحديث لهيكلة قاعدة البيانات؟ أشارككم قصة حقيقية وكيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من ليالي النشر الطويلة والمُجهدة،...

4 يونيو، 2026 قراءة المزيد

الشبكات والـ APIs

كانت إعادة المحاولة كارثة: كيف أنقذتنا مفاتيح عدم تكرار العمليات (Idempotency Keys) من جحيم الفواتير المزدوجة؟

أشارككم قصة حقيقية من الخنادق البرمجية، يوم كاد خطأ بسيط في إعادة محاولة طلبات الدفع أن يكلفنا سمعتنا وأموال عملائنا. اكتشفوا معنا كيف كانت مفاتيح...

4 يونيو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

كانت مهمتي البرمجية للاختبار مجرد كود: كيف أنقذني توثيق القرارات من جحيم الصمت بعد المقابلة؟

أشارككم قصة حقيقية من بداياتي، وكيف تعلمت بالطريقة الصعبة أن المهمة البرمجية ليست مجرد كتابة كود، بل هي فرصة لإظهار طريقة تفكيرك. اكتشف كيف يمكن...

4 يونيو، 2026 قراءة المزيد

التوسع والأداء العالي والأحمال

نمط قاطع الدائرة: كيف نجا نظامنا من جحيم الانهيارات المتسلسلة؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف تحول فشل بسيط في إحدى الخدمات إلى انهيار كارثي للنظام بأكمله. واكتشفوا معنا نمط "قاطع الدائرة" (Circuit...

4 يونيو، 2026 قراءة المزيد