خوارزميات

قاعدة بياناتنا كانت تستغيث: كيف أنقذنا ‘فلتر بلوم’ من جحيم التحقق المكلف من وجود العناصر؟

أبو عمر 12 أبريل، 2026 2 دقائق قراءة

مقدمة من قلب المعركة: يوم أن صرخت قاعدة البيانات

يا جماعة الخير، السلام عليكم ورحمة الله. معكم أخوكم أبو عمر.

قبل كم سنة، كنا شغالين على مشروع فيه نظام تسجيل مستخدمين ضخم، وكان من أهم الشروط إنو اسم المستخدم (username) يكون فريد من نوعه. في البداية، الأمور كانت “عال العال”. المستخدم الجديد يكتب اسمه، نبعت استعلام (query) لقاعدة البيانات، إشي زي هيك:

SELECT COUNT(*) FROM users WHERE username = 'the_chosen_username';

إذا النتيجة صفر، بنسجله. إذا واحد، بنقله “عفوًا، الاسم مأخوذ يا طيب، جرب غيره”.

المشكلة بلشت لما كبرت قاعدة المستخدمين وصارت بالملايين. كل عملية تسجيل جديدة صارت كابوس. سيرفر قاعدة البيانات كان دايمًا ينوح والـ CPU usage عنده ضارب في السقف. التطبيق صار بطيء والمستخدمين بلشوا يزهقوا. دخلنا في ورطة حقيقية، وصار لازم نلاقي حل جذري وسريع قبل ما ينهار كل النظام فوق راسنا.

في ليلة من ليالي القلق والبحث، وأنا أقلّب في أوراقي وكتبي القديمة، لمعت في ذهني فكرة قرأت عنها زمان: “هيكل بيانات احتمالي” (Probabilistic Data Structure). والاسم اللي ضل يرن في بالي هو “فلتر بلوم” (Bloom Filter). قلت لحالي، معقول هذا “الفلتر” هو طوق النجاة؟

ما هو ‘فلتر بلوم’ يا أبو عمر؟ ببساطة وبدون تعقيد

خليني أبسطلك الموضوع. تخيل إنك حارس أمن على باب حفلة كبيرة جدًا. معك قائمة بأسماء المدعوين، بس القائمة هاي مش ورقية، هي عبارة عن “ذاكرة” خاصة فيك.

لمّا يجي شخص، بتسأله عن اسمه. عندك حالتين:

إذا أنت متأكد 100% إنك ما سمعت بالاسم هاد قبل، بتقله فورًا وبكل ثقة: “آسف، اسمك مش موجود، ما بتقدر تفوت”. (هذا يعني أن العنصر بالتأكيد غير موجود).
إذا الاسم “رن” في ذاكرتك، بتقله: “مممم، الاسم مألوف. يمكن تكون مدعو. استنى لحظة خليني أتأكد من القائمة الرئيسية جوا”. (هذا يعني أن العنصر ربما يكون موجودًا).

فلتر بلوم هو هذا الحارس الذكي. هو هيكل بيانات فائق السرعة والكفاءة في استخدام الذاكرة، وظيفته يجاوب على سؤال واحد فقط: “هل هذا العنصر محتمل أن يكون ضمن مجموعة؟”.

الجميل فيه أنه:

إذا قال “لا”، فهو “لا” قاطعة بنسبة 100%. مستحيل يغلط ويقول عن عنصر موجود إنه مش موجود. (No false negatives).
إذا قال “نعم”، فهي “نعم” احتمالية. ممكن يكون العنصر فعلًا موجود، وممكن يكون “إنذار كاذب” (False Positive).

وهذا الإنذار الكاذب هو الثمن البسيط الذي ندفعه مقابل السرعة الخارقة وتوفير الذاكرة.

كيف يعمل هذا السحر؟ الغوص في الآلية الداخلية

الحكي النظري حلو، بس إحنا المبرمجين بنحب نشوف “المكاينات” كيف بتشتغل. فلتر بلوم قائم على مكونين أساسيين:

المكون الأول: مصفوفة البتات (The Bit Array)

تخيلها كشريط طويل جدًا من الأصفار. شريط ضخم كله нули. حجم هذا الشريط (خلينا نسميه m) هو أول قرار لازم تاخده.

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... , 0]

المكون الثاني: دوال التجزئة (Hash Functions)

عندنا مجموعة من دوال التجزئة (خلينا نسمي عددها k). وظيفة كل دالة من هاي الدوال إنها تاخد أي عنصر (زي اسم المستخدم “abu_omar”) وتحوله لرقم. هذا الرقم هو ببساطة “موقع” أو “خانة” (index) في مصفوفة البتات اللي حكينا عنها فوق.

نصيحة من أبو عمر: مش ضروري تكتب دوال التجزئة بنفسك. استخدم دوال سريعة ومشهورة زي MurmurHash أو FNV. المهم يكونوا دوال مختلفة ومستقلة عن بعضها قدر الإمكان لتقليل التصادمات.

عملية الإضافة (Adding an Element)

لما بدنا نضيف عنصر جديد للفلتر (مثلاً، اسم المستخدم “sami”)، بنعمل الآتي:

نمرر “sami” على دالة التجزئة الأولى (hash_1)، بتعطينا رقم، وليكن 2. بنروح عالمصفوفة وبنحول الخانة رقم 2 إلى 1.
نمرر “sami” على دالة التجزئة الثانية (hash_2)، بتعطينا رقم، وليكن 7. بنروح عالمصفوفة وبنحول الخانة رقم 7 إلى 1.
نمرر “sami” على دالة التجزئة الثالثة (hash_3)، بتعطينا رقم، وليكن 4. بنروح عالمصفوفة وبنحول الخانة رقم 4 إلى 1.

بعد إضافة “sami” باستخدام 3 دوال تجزئة، شكل المصفوفة بصير إشي زي هيك:

[0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, ... , 0]
       ^     ^        ^
    (hash_1) (hash_3) (hash_2)

عملية التحقق (Checking for an Element)

وهنا يكمن الجمال. لما بدنا نتأكد إذا اسم المستخدم “omar” موجود أو لأ، بنكرر نفس العملية:

نمرر “omar” على hash_1، hash_2، hash_3 ونحصل على المواقع المقابلة.
نتفقد قيم البتات في هذه المواقع داخل المصفوفة.
إذا كان أي بت منهم يساوي صفرًا، بنعرف فورًا وبشكل قاطع 100% أن “omar” لم تتم إضافته من قبل. ليش؟ لأنه لو تمت إضافته، لكانت كل هذه البتات قد تحولت إلى 1.
إذا كانت كل البتات في هذه المواقع تساوي واحدًا، هنا الفلتر يقول: “من المحتمل أن ‘omar’ موجود”. ليش محتمل؟ لأنه يمكن اسم ثاني (مثلاً “sami”) هو اللي حوّل هاي البتات لواحد بالصدفة. هذا هو الـ “False Positive”.

يلا نبرمج: بناء فلتر بلوم بسيط باستخدام بايثون

خلينا نشوف مثال عملي بسيط بلغة بايثون. راح نستخدم مكتبة mmh3 لدالة التجزئة MurmurHash3 لأنها سريعة وممتازة لهذا الغرض، ومكتبة bitarray للتعامل مع مصفوفة البتات بكفاءة.

أولًا، ثبت المكتبات:

pip install mmh3 bitarray

وهذا هو الكود:


import mmh3
from bitarray import bitarray

class BloomFilter:
    def __init__(self, size, hash_count):
        self.size = size
        self.hash_count = hash_count
        # إنشاء مصفوفة بتات كلها أصفار
        self.bit_array = bitarray(size)
        self.bit_array.setall(0)

    def add(self, item):
        """
        إضافة عنصر إلى الفلتر
        """
        for i in range(self.hash_count):
            # نستخدم 'i' كـ "seed" للحصول على دالة تجزئة مختلفة في كل مرة
            digest = mmh3.hash(item, i) % self.size
            self.bit_array[digest] = True
        print(f"تمت إضافة '{item}'")

    def check(self, item):
        """
        التحقق من وجود عنصر في الفلتر
        """
        for i in range(self.hash_count):
            digest = mmh3.hash(item, i) % self.size
            if self.bit_array[digest] == False:
                # إذا وجدنا صفر واحد، فالعنصر بالتأكيد غير موجود
                return False
        # إذا كانت كل البتات واحد، فالعنصر "محتمل" أن يكون موجودًا
        return True

# --- مثال عملي ---
# لنفترض أننا نتوقع 1000 عنصر ونريد نسبة خطأ 1%
# باستخدام حاسبة فلتر بلوم على الإنترنت، نحتاج:
# حجم مصفوفة (m) حوالي 9585 بت
# عدد دوال التجزئة (k) حوالي 7

bf = BloomFilter(size=9585, hash_count=7)

# إضافة أسماء مستخدمين موجودة بالفعل
bf.add("abu_omar")
bf.add("sami_dev")
bf.add("reem_coder")

print("-" * 20)

# التحقق من اسم موجود
username_to_check = "abu_omar"
if bf.check(username_to_check):
    print(f"الفلتر يقول: '{username_to_check}' قد يكون موجودًا. (وهو كذلك)")
else:
    print(f"الفلتر يقول: '{username_to_check}' بالتأكيد غير موجود.")

print("-" * 20)

# التحقق من اسم غير موجود
username_to_check = "jad_hacker"
if bf.check(username_to_check):
    # هذا هو احتمال الإنذار الكاذب
    print(f"الفلتر يقول: '{username_to_check}' قد يكون موجودًا. (تحقق من قاعدة البيانات!)")
else:
    print(f"الفلتر يقول: '{username_to_check}' بالتأكيد غير موجود. (لا داعي للتحقق من قاعدة البيانات!)")

العودة إلى أرض المعركة: كيف طبقنا الحل؟

بعد ما فهمنا النظرية وطبقناها، رجعنا لمشكلتنا الأصلية. الخطة كانت كالتالي:

عند بدء تشغيل الخادم (Server)، نقوم بتحميل كل أسماء المستخدمين من قاعدة البيانات ونضيفها إلى فلتر بلوم موجود في الذاكرة (In-memory). هذه عملية تتم مرة واحدة.
عندما يحاول مستخدم جديد التسجيل باسم معين، نتبع الخوارزمية الجديدة:
1. الخطوة الأولى: تحقق من الاسم في فلتر بلوم.
2. إذا قال الفلتر “لا” (False): يا سلام! هذا يعني أن الاسم متاح 100%. نسمح للمستخدم بالتسجيل فورًا ونضيف الاسم الجديد إلى قاعدة البيانات وإلى فلتر بلوم في الذاكرة. لم نلمس قاعدة البيانات لعملية القراءة!
3. إذا قال الفلتر “نعم” (True): هنا فقط، وفي هذه الحالة فقط، نذهب وننفذ الاستعلام المكلف على قاعدة البيانات SELECT COUNT(*) ... لنتأكد 100%. إذا كان الاسم موجودًا بالفعل، نخبر المستخدم. إذا لم يكن موجودًا (وهذا هو الإنذار الكاذب)، نسمح له بالتسجيل ونضيفه.

النتيجة كانت مذهلة. بما أن نسبة الإنذار الكاذب كانت منخفضة (حوالي 1%)، فقد تمكنا من تجنب 99% من استعلامات التحقق التي كانت تقتل قاعدة بياناتنا. انخفض الحمل على السيرفر بشكل دراماتيكي، والتطبيق صار “يُطلق رصاص”. قاعدة البيانات أخيرًا استطاعت أن تتنفس الصعداء.

نصائح من الخبير: متى وكيف تستخدم فلتر بلوم؟

فلتر بلوم ليس حلًا لكل المشاكل، لكنه سلاح فتاك في المواقف الصحيحة. استخدمه عندما:

تحتاج للتحقق من وجود عنصر في مجموعة بيانات ضخمة جدًا لا تتسع في الذاكرة.
تكون عملية التحقق من المصدر الأساسي (قاعدة بيانات، قرص صلب، شبكة) مكلفة وبطيئة.
يمكنك تحمل نسبة صغيرة من الإنذارات الكاذبة (False Positives).
لا تحتاج إلى حذف العناصر من المجموعة (فلتر بلوم القياسي لا يدعم الحذف، لكن هناك نسخ متقدمة مثل Counting Bloom Filter تدعم ذلك بتكلفة ذاكرة أعلى).

أمثلة من العالم الحقيقي:

متصفح جوجل كروم: يستخدمه للتحقق مما إذا كان رابط URL معين هو رابط ضار أو لموقع تصيد (phishing). يقوم بتخزين قائمة ضخمة من الروابط الضارة في فلتر بلوم. إذا قال الفلتر “لا”، فأنت بأمان. إذا قال “نعم”، يقوم كروم بإجراء فحص أكثر دقة.
قواعد بيانات NoSQL: مثل Google Bigtable و Apache Cassandra، تستخدمه لتجنب البحث في القرص الصلب عن بيانات غير موجودة، مما يسرّع عمليات القراءة بشكل كبير.
أنظمة التوصية (Recommendation Systems): يستخدم لمنع عرض المقالات أو المنتجات التي شاهدها المستخدم بالفعل.

الموازنة الصعبة: حجم الفلتر، عدد دوال التجزئة، واحتمالية الخطأ

هناك علاقة رياضية تربط بين حجم المصفوفة (m)، عدد العناصر المتوقع (n)، عدد دوال التجزئة (k)، واحتمالية الخطأ (p). الزبدة هي:

لتقليل احتمالية الخطأ، تحتاج إلى مصفوفة أكبر.
لكل حجم مصفوفة وعدد عناصر، هناك عدد “مثالي” من دوال التجزئة يقلل من احتمالية الخطأ.

لا تتعب نفسك بالحسابات. استخدم أي حاسبة فلتر بلوم على الإنترنت (ابحث عن “Bloom filter calculator”). أدخل عدد العناصر التي تتوقعها ونسبة الخطأ التي تتحملها، وستعطيك حجم المصفوفة وعدد دوال التجزئة الأمثل.

خلاصة الكلام: الفلتر الذي أنقذ الموقف 💡

فلتر بلوم هو مثال عبقري على كيف يمكن للتفكير “خارج الصندوق” وحلول الخوارزميات الكلاسيكية أن تنقذنا في عالم اليوم المعقد. هو ليس مجرد كود، بل هو فلسفة: المقايضة الذكية بين الدقة المطلقة والأداء الفائق.

في قصتنا، قايضنا اليقين بنسبة 1% مقابل تحسين الأداء بنسبة 99%. وكانت صفقة رابحة بكل المقاييس.

نصيحتي الأخيرة لك يا صديقي المبرمج: لا تخف من الخوارزميات وهياكل البيانات. هي ليست مجرد نظريات أكاديمية معقدة، بل هي أدوات حقيقية في صندوق عدتك. في المرة القادمة التي تواجه فيها مشكلة أداء، تذكر قصة أبو عمر وفلتر بلوم، وابحث عن الحل الذكي، وليس بالضرورة الحل الأكثر وضوحًا.

ودمتم سالمين.

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

خوارزميات

كودي كان يعمل على جهازي لكنه ينهار في الإنتاج: كيف أنقذني تحليل ‘Big O’ من جحيم الأداء غير المتوقع؟

أشارككم قصة حقيقية من مسيرتي كمبرمج، عندما كاد تطبيق كامل أن ينهار بسبب كود بدا بريئاً على جهازي. اكتشفوا معي كيف أن فهم تحليل التعقيد...

6 أبريل، 2026 قراءة المزيد

خوارزميات

كانت خرائطنا تبحث في كل شارع: كيف أنقذتنا خوارزمية A* من جحيم البحث الشامل؟

أتذكر جيداً ذلك المشروع في بداياتي، حيث كنا نبني نظاماً بسيطاً لتوصيل الطلبات. كانت الخوارزمية التي استخدمناها لإيجاد أقصر مسار للسائق أشبه بشخص تائه يبحث...

4 مايو، 2026 قراءة المزيد

بودكاست

خوارزميات

خوارزمية A*: دليلك الشامل لإيجاد المسار الأمثل في الذكاء الاصطناعي والألعاب (مع أمثلة عملية)

اكتشف قوة خوارزمية A* في إيجاد المسار الأمثل بكفاءة عالية. تعرف على كيفية عملها، تطبيقاتها، وكيفية تطبيقها عملياً في مشاريعك الخاصة في الذكاء الاصطناعي وتطوير...

27 ديسمبر، 2025 قراءة المزيد

خوارزميات

بحثي كان أعمى وبطيء: كيف أنقذتني ‘مرشحات بلوم’ (Bloom Filters) من جحيم التحقق المكلف؟

أشارككم قصة حقيقية من مسيرتي كمبرمج، عندما كادت استعلامات التحقق البسيطة أن تدمر أداء نظام كامل. سأشرح لكم كيف كانت خوارزمية "مرشح بلوم" (Bloom Filter)...

4 أبريل، 2026 قراءة المزيد

خوارزميات

كانت مهامنا تتنفذ بعشوائية: كيف أنقذنا ‘الفرز الطوبولوجي’ من جحيم الاعتماديات المتشابكة؟

في عالم البرمجة، الاعتماديات المتشابكة كابوس حقيقي. تعالوا أحكي لكم قصة كيف أنقذتنا خوارزمية 'الفرز الطوبولوجي' من الفوضى، وحولت مهامنا العشوائية إلى خطة عمل واضحة...

27 مايو، 2026 قراءة المزيد

خوارزميات

بحثي كان يستغرق دهراً: كيف أنقذتني ‘جداول التجزئة’ (Hash Tables) من جحيم البحث الخطي؟

أتذكر مشروعاً كاد أن يفشل بسبب بطء البحث في البيانات، حيث كانت كل عملية تستغرق وقتاً طويلاً ومزعجاً. في هذه المقالة، أشارككم قصتي وكيف كانت...

1 أبريل، 2026 قراءة المزيد

خوارزميات

كنا نرهق قاعدة البيانات بسؤال ‘هل هذا موجود؟’: كيف أنقذنا ‘فلتر بلوم’ من جحيم الاستعلامات غير الضرورية؟

في هذه المقالة، أسرد لكم قصة حقيقية من واقع العمل، كيف أنقذنا نظامنا من ضغط الاستعلامات الهائل باستخدام هيكل بيانات بسيط وعبقري يُدعى "فلتر بلوم"....

21 مايو، 2026 قراءة المزيد

خوارزميات

جداول التجزئة (Hash Tables): كيف أنقذتنا من جحيم البحث عن إبرة في كومة قش؟

أشارككم قصة حقيقية من ميدان البرمجة، كيف كنا نغرق في بحر من البيانات البطيئة، وكيف كانت "جداول التجزئة" طوق النجاة الذي حوّل البحث من عملية...

13 أبريل، 2026 قراءة المزيد

خوارزميات

كنا نسير في كل الطرق الممكنة: كيف أنقذتنا خوارزمية A* من جحيم البحث الأعمى؟

تذكرون تلك المشاريع التي تتوه فيها الخوارزميات كمن ضل طريقه في أزقة مدينة قديمة؟ في هذه المقالة، سأروي لكم كيف انتقلنا من البحث الأعمى المُحبط...

25 أبريل، 2026 قراءة المزيد

آخر المدونات

برمجة وقواعد بيانات

تحديثات قاعدة البيانات بدون توقف: كيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من جحيم التوقفات المجدولة؟

هل سئمت من إيقاف الخدمة مع كل تحديث لهيكلة قاعدة البيانات؟ أشارككم قصة حقيقية وكيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من ليالي النشر الطويلة والمُجهدة،...

4 يونيو، 2026 قراءة المزيد

الشبكات والـ APIs

كانت إعادة المحاولة كارثة: كيف أنقذتنا مفاتيح عدم تكرار العمليات (Idempotency Keys) من جحيم الفواتير المزدوجة؟

أشارككم قصة حقيقية من الخنادق البرمجية، يوم كاد خطأ بسيط في إعادة محاولة طلبات الدفع أن يكلفنا سمعتنا وأموال عملائنا. اكتشفوا معنا كيف كانت مفاتيح...

4 يونيو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

كانت مهمتي البرمجية للاختبار مجرد كود: كيف أنقذني توثيق القرارات من جحيم الصمت بعد المقابلة؟

أشارككم قصة حقيقية من بداياتي، وكيف تعلمت بالطريقة الصعبة أن المهمة البرمجية ليست مجرد كتابة كود، بل هي فرصة لإظهار طريقة تفكيرك. اكتشف كيف يمكن...

4 يونيو، 2026 قراءة المزيد

التوسع والأداء العالي والأحمال

نمط قاطع الدائرة: كيف نجا نظامنا من جحيم الانهيارات المتسلسلة؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف تحول فشل بسيط في إحدى الخدمات إلى انهيار كارثي للنظام بأكمله. واكتشفوا معنا نمط "قاطع الدائرة" (Circuit...

4 يونيو، 2026 قراءة المزيد