خوارزميات

كانت قاعدة بياناتنا تستنزفها الأشباح: كيف أنقذتنا ‘مرشحات بلوم’ من جحيم الاستعلامات الضائعة؟

أبو عمر 9 مايو، 2026 2 دقائق قراءة

قهوة باردة وأعصاب محروقة: حكايتي مع الأشباح الرقمية

يا جماعة الخير، بتذكر هذاك اليوم زي كأنه امبارح. كنا قاعدين في المكتب، الساعة كانت داخلة على ثلاثة الفجر، والقهوة اللي قدامي بردت وصارت زي طعم الخيبة. كنا أطلقنا ميزة جديدة في تطبيقنا بتسمح للمستخدمين يختاروا اسم مستخدم فريد. فكرة بسيطة، صح؟ لكن اللي صار كان كابوس.

السيرفرات كانت بتولّع، وقاعدة البيانات بتصرخ وبتطلب الرحمة. كل عملية تسجيل جديدة، وكل مرة واحد بيكتب اسم مستخدم عشان يشوف إذا متاح، كان التطبيق يبعت استعلام (Query) مباشر لقاعدة البيانات. المشكلة ما كانت في الأسماء الموجودة، المشكلة كانت في “الأشباح”… الأسماء اللي مش موجودة أصلاً!

تخيل معي ملايين المستخدمين بجربوا أسماء عشوائية: “ahmad123”, “ahmad1234”, “super_ahmad_2024”. كل محاولة فاشلة من هاي كانت بتكلفنا استعلام كامل على قاعدة بيانات ضخمة، عشان في الآخر يرجع الجواب: “مش موجود”. كنا بنصرف 90% من موارد قاعدة البيانات عشان نبحث عن أشباح! وقتها، مسكت راسي وحكيت للفريق: “يا حبايب، إحنا بنحارب طواحين الهوا. لازم نلاقي طريقة نفلتر هاي الطلبات قبل ما توصل للـ Database أصلًا”. وهنا، لمعت في بالي فكرة قديمة، حل أنيق وبسيط اسمه: مرشح بلوم (Bloom Filter).

ما هو “مرشح بلوم”؟ الحارس الذكي الذي لا ينام

ببساطة شديدة، مرشح بلوم هو هيكل بيانات احتمالي (Probabilistic Data Structure) مصمم ليجيب على سؤال واحد بسرعة فائقة وكفاءة في استخدام الذاكرة: “هل هذا العنصر عضو في هذه المجموعة؟”.

لاحظوا إني حطيت خط تحت كلمة “احتمالي”. هاي هي الكلمة السحرية. الجواب اللي بيعطينا إياه مرشح بلوم مش دايماً دقيق 100%، لكنه ذكي جداً في طريقة خطأه. إجاباته بتكون واحدة من اثنتين:

“هذا العنصر بالتأكيد ليس في المجموعة.” (No)
“هذا العنصر ربما يكون في المجموعة.” (Maybe)

ما في عنده إجابة “نعم بالتأكيد”. وهذا هو سر قوته! هو مستحيل يخطئ ويقولك عن عنصر موجود إنه “مش موجود” (False Negative). لكن ممكن يخطئ ويقولك عن عنصر مش موجود إنه “ممكن يكون موجود” (False Positive). وهاد الخطأ إحنا بنقدر نتحكم فيه ونتعايش معه، زي ما رح نشوف.

تخيل مرشح بلوم زي حارس أمن على باب حفلة كبيرة. معه قائمة سريعة ومشوشة شوي بأسماء المدعوين. لما تسأله عن اسم، إذا الاسم مش موجود على قائمته المشوشة، هو متأكد 100% إنك مش مدعو. لكن إذا الاسم موجود، بقولك “تفضل، ممكن تكون مدعو، بس لازم تتأكد من القائمة الرئيسية اللي جوا”. هو بيمنع 99% من غير المدعوين من إزعاج المنظمين جوا، وهذا هو المطلوب تماماً!

كيف يعمل هذا السحر؟ نظرة تحت الغطاء

الفكرة عبقرية في بساطتها. مرشح بلوم بيتكون من شغلتين أساسيتين:

مصفوفة بتات (Bit Array): تخيلها سلسلة طويلة من الأصفار، زي هيك: `[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]`
عدة دوال تجزئة (Hash Functions): مجموعة من الدوال المستقلة عن بعضها، كل وظيفتها تاخد أي مُدخل (زي اسم المستخدم) وتحوله لرقم عشوائي ضمن حجم مصفوفة البتات.

مرحلة الإضافة (Adding an Item)

لما بدنا نضيف عنصر جديد (مثلاً اسم المستخدم “abu_omar”) للمرشح، بنعمل الآتي:

بنمرر العنصر “abu_omar” على كل دالة من دوال التجزئة (خلينا نفترض عنا 3 دوال).
كل دالة رح تعطينا رقم (index) مختلف. مثلاً:
- hash1("abu_omar") -> 2
- hash2("abu_omar") -> 5
- hash3("abu_omar") -> 8
بنروح على مصفوفة البتات، وبنحول الخانات اللي طلعت معنا لـ 1. فبتصير المصفوفة: `[0, 0, 1, 0, 0, 1, 0, 0, 1, 0]`

بنكرر هاي العملية لكل اسم مستخدم موجود عنا في قاعدة البيانات. مع الوقت، رح تلاقي إن المصفوفة صارت مليانة “واحدات” في أماكن متفرقة.

مرحلة التحقق (Checking for an Item)

هاي هي المرحلة الأهم. لما يجي مستخدم جديد ويجرب اسم، مثلاً “sami”، بنعمل الآتي:

بنمرر الاسم “sami” على نفس دوال التجزئة الثلاثة.
لنفترض النتائج كانت:
- hash1("sami") -> 3
- hash2("sami") -> 7
- hash3("sami") -> 9
بنروح على مصفوفة البتات وبنتفقد الخانات هاي: الخانة رقم 3، ورقم 7، ورقم 9.
إذا لقينا ولو خانة واحدة بس قيمتها 0، بنكون متأكدين 100% إن الاسم “sami” عمره ما انضاف للمرشح من قبل. بنرجع جواب “الاسم متاح” فوراً بدون ما نلمس قاعدة البيانات!
أما إذا لقينا كل الخانات (3، 7، 9) قيمتها 1، هنا بنقول: “هممم، محتمل إن الاسم موجود”. ليش محتمل؟ لأنه ممكن اسم تاني خالص (مثلاً “user123”) هو اللي حوّل هاي الخانات لـ 1 بالصدفة. في هاي الحالة فقط، وفقط في هاي الحالة، بنروح بنسأل قاعدة البيانات عشان نحصل على جواب قاطع.

مثال برمجي بسيط (Python)

حتى تكون الصورة أوضح، هاي طريقة بسيطة جداً لبناء مرشح بلوم باستخدام بايثون ومكتبة `mmh3` لدوال التجزئة.


# pip install mmh3 bitarray
import mmh3
from bitarray import bitarray

class BloomFilter:
    def __init__(self, size, hash_count):
        # حجم مصفوفة البتات
        self.size = size
        # عدد دوال التجزئة
        self.hash_count = hash_count
        # إنشاء مصفوفة البتات، كلها أصفار في البداية
        self.bit_array = bitarray(size)
        self.bit_array.setall(0)

    def add(self, item):
        """إضافة عنصر إلى المرشح"""
        for i in range(self.hash_count):
            # نستخدم دالة تجزئة واحدة مع "seed" مختلف لمحاكاة دوال متعددة
            digest = mmh3.hash(item, i) % self.size
            self.bit_array[digest] = 1

    def check(self, item):
        """التحقق من وجود العنصر"""
        for i in range(self.hash_count):
            digest = mmh3.hash(item, i) % self.size
            # إذا وجدنا بت واحد فقط قيمته صفر، فالعنصر غير موجود بالتأكيد
            if self.bit_array[digest] == 0:
                return False
        # إذا كانت كل البتات واحد، فالعنصر قد يكون موجوداً
        return True

# --- مثال عملي ---
# لنفترض أن لدينا مليون اسم مستخدم، ونريد نسبة خطأ 1%
# باستخدام حاسبة مرشح بلوم، نحتاج مصفوفة بحجم 9.6 مليون بت تقريباً و 7 دوال تجزئة
# للتسهيل، سنستخدم أرقام أصغر هنا
bloom = BloomFilter(size=100, hash_count=4)

# أسماء المستخدمين الموجودة في قاعدة بياناتنا
existing_users = ["abu_omar", "reem", "khalid", "sara"]

# إضافة المستخدمين الموجودين للمرشح
for user in existing_users:
    bloom.add(user)

# --- الآن مرحلة الاختبار ---

# 1. التحقق من مستخدم موجود بالفعل
print(f"هل 'abu_omar' موجود؟ {bloom.check('abu_omar')}")  # سيرجع True (صحيح)

# 2. التحقق من مستخدم غير موجود بالتأكيد
print(f"هل 'ahmad123' موجود؟ {bloom.check('ahmad123')}") # غالباً سيرجع False (صحيح)

# 3. حالة الخطأ الإيجابي (False Positive) - قد تحدث نادراً
# لنجرب اسماً عشوائياً غير موجود
print(f"هل 'random_user_xyz' موجود؟ {bloom.check('random_user_xyz')}") # قد يرجع True بالصدفة!

في المثال أعلاه، لما نسأل عن ‘ahmad123’، المرشح سيرجع `False` بسرعة البرق، وبالتالي نوفر على أنفسنا استعلامًا مكلفًا لقاعدة البيانات. أما في حالة `True`، فنحن مضطرون للتحقق من قاعدة البيانات للتأكد.

مشكلة الخطأ الإيجابي وكيفية السيطرة عليها

أكيد بتسأل حالك: “طيب يا أبو عمر، إذا كان في نسبة خطأ، شو الفايدة؟”. الجواب هو أن هذه النسبة تحت سيطرتنا الكاملة. نسبة الخطأ الإيجابي (False Positive Rate) تعتمد على 3 عوامل:

m: حجم مصفوفة البتات. كلما كانت أكبر، قلّت فرصة تصادم البتات وقلّ الخطأ.
n: عدد العناصر المتوقع إضافتها للمرشح. كلما زادت العناصر، زاد ازدحام المصفوفة وزاد الخطأ.
k: عدد دوال التجزئة. هناك عدد أمثل لدوال التجزئة يقلل نسبة الخطأ لأدنى حد ممكن.

الجميل في الموضوع أن هناك معادلات رياضية وحاسبات جاهزة على الإنترنت. أنت فقط تحدد عدد العناصر التي تتوقعها (n) ونسبة الخطأ التي تتحملها (p)، وهي تعطيك الحجم الأمثل للمصفوفة (m) والعدد الأمثل لدوال التجزئة (k). فمثلاً، لو أردت تخزين مليون عنصر بنسبة خطأ لا تتجاوز 0.1%، ستحتاج لمصفوفة بحجم 1.7 ميغابايت فقط و 10 دوال تجزئة. هذا حجم تافه في ذاكرة الخادم مقابل الفائدة الجبارة التي ستحصل عليها!

نصائح أبو عمر العملية 💡

من خبرتي في الميدان، هاي شوية نصائح من القلب لما تقرر تستخدم مرشحات بلوم:

اعرف متى لا تستخدمه: مرشح بلوم القياسي لا يدعم عملية الحذف. بمجرد أن تضع بتًا على 1، لا يمكنك إعادته إلى 0، لأنك قد تؤثر على عناصر أخرى تشترك في نفس البت. إذا كنت بحاجة للحذف، ابحث عن بدائل مثل (Counting Bloom Filter) ولكنها أكثر تعقيداً وتستهلك ذاكرة أكبر.
الحجم هو كل شيء: لا تبخل في حجم مصفوفة البتات. تقدير عدد العناصر التي ستضيفها بشكل خاطئ (أقل من الواقع) سيؤدي إلى ارتفاع نسبة الخطأ الإيجابي بشكل كبير، وهذا سيفقد المرشح قيمته. كن كريماً في تقديراتك.
لا تخترع العجلة: في بيئة الإنتاج (Production)، لا تقم ببناء مرشح بلوم من الصفر. استخدم مكتبات موثوقة ومختبرة جيداً في لغة البرمجة التي تستخدمها (مثل Guava في Java، أو `pybloom_live` في Python). هذه المكتبات تكون محسّنة وجاهزة.
احتضن الـ “Maybe”: تذكر دائماً أن الهدف ليس الدقة المطلقة، بل التصفية. الهدف هو التخلص من 99% من “اللا” المؤكدة بتكلفة شبه صفرية. الـ 1% المتبقية التي تحتاج إلى تحقق إضافي هي الثمن الذي ندفعه مقابل هذا الأداء الخارق.

الخلاصة: كيف أنقذنا مرشح بلوم؟

بالعودة لقصتنا، طبقنا مرشح بلوم بالضبط. قمنا بتحميل كل أسماء المستخدمين الموجودة في قاعدة البيانات إلى مرشح بلوم في ذاكرة الخادم عند بدء التشغيل. أي طلب للتحقق من اسم مستخدم جديد كان يمر أولاً عبر المرشح. النتيجة؟

انخفض الضغط على قاعدة البيانات بنسبة تزيد عن 85%! معظم الاستعلامات “الشبحية” كانت تموت عند بوابة مرشح بلوم. الخوادم هدأت، والقهوة رجعت تنشرب وهي ساخنة، وأنا وفريقي استطعنا أخيراً النوم ليلاً.

مرشح بلوم هو مثال رائع على كيف أن الحلول البسيطة والأنيقة، حتى لو كانت احتمالية، يمكن أن تكون أكثر فعالية من الحلول المعقدة والدقيقة في سياقات معينة. فلا تخف من هياكل البيانات الاحتمالية، ففي عالم الأداء والكفاءة، “الجيّد بما يكفي” غالباً ما يكون أفضل من “المثالي”. 😉

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

بودكاست

خوارزميات

خوارزمية A*: دليلك الشامل لإيجاد المسار الأمثل في الذكاء الاصطناعي والألعاب (مع أمثلة عملية)

اكتشف قوة خوارزمية A* في إيجاد المسار الأمثل بكفاءة عالية. تعرف على كيفية عملها، تطبيقاتها، وكيفية تطبيقها عملياً في مشاريعك الخاصة في الذكاء الاصطناعي وتطوير...

27 ديسمبر، 2025 قراءة المزيد

خوارزميات

مساراتي كانت عشوائية ومكلفة: كيف أنقذتني خوارزمية A* (A-Star) من جحيم التخطيط غير الفعال؟

أشارككم قصتي مع مشروع روبوت صغير كاد أن يفشل بسبب التخطيط العشوائي للمسارات، وكيف كانت خوارزمية A* (A-Star) بمثابة طوق النجاة. سنتعمق في هذه الخوارزمية...

4 أبريل، 2026 قراءة المزيد

بودكاست

خوارزميات

من فوضى الخوادم إلى نظام ذكي: تصميم خوارزمية جدولة مهام معقدة مع أبو عمر

مقالة عملية من واقع التجربة تشرح كيفية تصميم خوارزمية جدولة مهام (Job Scheduling) فعّالة للأنظمة الموزعة. ننتقل من مشاكل الجدولة العشوائية إلى حلول ذكية قائمة...

22 يناير، 2026 قراءة المزيد

خوارزميات

حساباتنا كانت تعيد اختراع العجلة: كيف أنقذتنا ‘البرمجة الديناميكية’ من جحيم التكرار الحاسوبي؟

أشارككم قصة من قلب المعركة البرمجية، كيف كاد التكرار أن يقتل أداء نظامنا، وكيف ظهرت "البرمجة الديناميكية" كالمنقذ. في هذه المقالة، سنغوص في هذا المفهوم...

24 أبريل، 2026 قراءة المزيد

خوارزميات

مساراتي كانت متاهة: كيف أنقذتني خوارزمية دايكسترا من البحث العشوائي عن أقصر طريق؟

أشارككم قصة شخصية عن التيه في التخطيط وكيف تحولت الفوضى إلى نظام بفضل خوارزمية 'دايكسترا'. سنتعلم معًا، خطوة بخطوة وبالكود، كيف تجد هذه الخوارزمية العبقرية...

27 مارس، 2026 قراءة المزيد

خوارزميات

فلاتر بلوم (Bloom Filters): كيف أنقذتنا من جحيم استعلامات قاعدة البيانات المكلفة؟

في إحدى ليالي الإطلاق المحمومة، كانت قاعدة بياناتنا على وشك الانهيار بسبب استعلام بسيط. أروي لكم كيف أنقذتنا خوارزمية بسيطة وعبقرية تُدعى "فلتر بلوم" (Bloom...

20 أبريل، 2026 قراءة المزيد

خوارزميات

كانت خرائطنا تضلل المستخدمين: كيف أنقذتنا خوارزمية A* من جحيم المسارات غير المنطقية؟

أشارككم قصة حقيقية عن معاناة فريقنا مع تطبيق خرائط كان يرسم مسارات كارثية، وكيف كانت خوارزمية A* هي طوق النجاة الذي غيّر كل شيء. هذه...

1 مايو، 2026 قراءة المزيد

خوارزميات

مساراتنا كانت متاهة من الاحتمالات: كيف أنقذتنا ‘خوارزمية البحث A*’ من جحيم استكشاف الطرق غير المجدية؟

أشارككم قصة من أيام تطوير الألعاب، وكيف كانت شخصياتنا "غشيمة" في إيجاد طريقها، قبل أن تأتي خوارزمية A* (A-Star) بمعادلتها السحرية لتنير لنا الدرب. هذه...

12 أبريل، 2026 قراءة المزيد

خوارزميات

كنا نسأل قاعدة البيانات عن كل شاردة وواردة: كيف أنقذتنا ‘مرشحات بلوم’ (Bloom Filters) من جحيم استعلامات التحقق؟

في عالم تطوير البرمجيات، غالبًا ما تكون الحلول الأكثر عبقرية هي الأبسط. أشارككم قصة من قلب المعركة مع قواعد البيانات البطيئة، وكيف أنقذتنا خوارزمية احتمالية...

26 أبريل، 2026 قراءة المزيد

آخر المدونات

التكنلوجيا المالية Fintech

كانت دفاترنا لا تتطابق أبداً: كيف أنقذنا ‘نظام التسوية الآلي’ من جحيم الأخطاء المالية الصامتة؟

أشارككم قصة حقيقية من قلب المعركة التقنية، كيف واجهنا كابوس عدم تطابق السجلات المالية الذي كاد أن يودي بشركتنا. نستعرض رحلة بناء نظام تسوية آلي...

9 مايو، 2026 قراءة المزيد

البنية التحتية وإدارة السيرفرات

كانت حاوياتنا جزراً منعزلة: كيف أنقذنا Kubernetes من جحيم التنسيق اليدوي؟

أشارككم قصة من أرض المعركة التقنية، كيف انتقلنا من فوضى إدارة حاويات Docker اليدوية إلى عالم الأتمتة المنظم مع Kubernetes. مقالة عملية للمطورين ومسؤولي الأنظمة...

9 مايو، 2026 قراءة المزيد

ادارة الفرق والتنمية البشرية

كان الصمت يقتل ابتكارنا: كيف أنقذتنا ‘ثقافة الأمان النفسي’ من جحيم الخوف من الفشل؟

أتذكر جيداً ذلك اليوم الذي كاد فيه الصمت أن يدمّر مشروعاً عملنا عليه لشهور. في هذه المقالة، أشارككم قصة كيف انتقلنا من بيئة عمل يسودها...

9 مايو، 2026 قراءة المزيد

اختبارات الاداء والجودة

كانت بيئة الإنتاج حقل ألغام: كيف أنقذتنا ‘هندسة الفوضى’ من جحيم الأعطال؟

أشارككم قصة حقيقية من قلب المعركة مع الأعطال المفاجئة في بيئة الإنتاج، وكيف كانت "هندسة الفوضى" (Chaos Engineering) هي طوق النجاة الذي حوّل أنظمتنا من...

9 مايو، 2026 قراءة المزيد

أدوات وانتاجية

كانت معرفتي التقنية تتلاشى: كيف أنقذني نظام ‘الدماغ الثاني’ من جحيم إعادة اختراع العجلة؟

أشارككم قصتي كـ "أبو عمر"، مطور برمجيات، مع تلاشي المعرفة التقنية وكيف أنقذني بناء "دماغ ثانٍ" باستخدام أداة مثل Obsidian. اكتشفوا كيف تحولت من إعادة...

9 مايو، 2026 قراءة المزيد

أتمتة العمليات

كانت مهامنا الخلفية كابوساً من السباغيتي: كيف أنقذتنا ‘محركات سير العمل’ (Workflow Engines) من جحيم الفشل الصامت؟

بصفتي مبرمجاً فلسطينياً، مررت بلحظات من الفوضى المطلقة في إدارة المهام الخلفية المعقدة. في هذه المقالة، أشارككم قصة كيف أنقذتنا "محركات سير العمل" من كود...

9 مايو، 2026 قراءة المزيد

نصائح برمجية

كان كودنا ينهار عند أول مفاجأة: كيف أنقذتنا ‘البرمجة الدفاعية’ من جحيم الثقة العمياء بالمدخلات؟

أنا أبو عمر، وفي هذه المقالة سأشارككم قصة حقيقية عن مشروع كاد أن يفشل بسبب الثقة الزائدة في المدخلات. سنتعلم معًا كيف أنقذتنا "البرمجة الدفاعية"...

9 مايو، 2026 قراءة المزيد

معمارية البرمجيات

كان تحديث نظامنا القديم أشبه بجراحة قلب مفتوح: كيف أنقذنا نمط ‘التين الخانق’ من جحيم المخاطرة الكبرى؟

أشارككم قصة حقيقية من قلب المعركة التقنية، حيث واجهنا مهمة تحديث نظام قديم ومعقد. في هذه المقالة، سأشرح كيف أنقذنا نمط "التين الخانق" (Strangler Fig...

9 مايو، 2026 قراءة المزيد

ذكاء اصطناعي

كان بحثنا أعمى للمعنى: كيف أنقذتنا قواعد بيانات المتجهات من جحيم البحث الحرفي؟

مقالة من مبرمج فلسطيني يروي فيها كيف أنقذت قواعد بيانات المتجهات (Vector Databases) فريقه من كابوس البحث الحرفي. اكتشف معنا كيف انتقلنا من البحث الذي...

9 مايو، 2026 قراءة المزيد

قهوة باردة وأعصاب محروقة: حكايتي مع الأشباح الرقمية

ما هو “مرشح بلوم”؟ الحارس الذكي الذي لا ينام

كيف يعمل هذا السحر؟ نظرة تحت الغطاء

مرحلة الإضافة (Adding an Item)

مرحلة التحقق (Checking for an Item)

مثال برمجي بسيط (Python)

مشكلة الخطأ الإيجابي وكيفية السيطرة عليها

نصائح أبو عمر العملية 💡

الخلاصة: كيف أنقذنا مرشح بلوم؟

سجل دخولك لعمل نقاش تفاعلي

مراجعة رأيك قبل النشر

آراء من النقاشات

مقالات ذات صلة

آخر المدونات