اعتقدت أن تطبيقي صاروخ… حتى سحقه 100 مستخدم: كيف كشف اختبار الحِمل عنق الزجاجة الخفي؟

أبو عمر 6 مارس، 2026 1 دقائق قراءة

يا جماعة الخير، السلام عليكم ورحمة الله وبركاته. معكم أخوكم أبو عمر.

اسمحوا لي أبدأ معكم بقصة صارت معي قبل كم سنة. كنت وقتها شغال على تطبيق شخصي سميته “جدولي”، فكرته بسيطة: أداة لإدارة المهام والمواعيد للطلاب والمهنيين. قضيت شهور وأنا أبرمج فيه، “أكتك” كل تفصيلة، وأهتم بواجهة المستخدم، وأتأكد إنه كل شيء شغال “زي الحلاوة”. على جهازي، وعلى سيرفر التطوير الصغير اللي كنت حاطه، كان التطبيق “صاروخ” بكل معنى الكلمة. أي عملية بتصير بأقل من 100 ميللي ثانية. كنت فخور جدًا بالنتيجة ومتحمس للإطلاق.

قررت أعمل إطلاق بسيط ومحدود، نشرت التطبيق في مجموعة لطلاب جامعتي القديمة على فيسبوك. في أول ساعة، كان كل شيء تمام. 10 مستخدمين، 20، 30… والأمور مستقرة. فجأة، بدأت توصلني رسايل: “أبو عمر، التطبيق بطيء جدًا!”، “يا رجل الصفحة الرئيسية مش راضية تفتح!”، “كل ما أضيف مهمة بعلّق!”.

فتحت لوحة المراقبة (Monitoring Dashboard) وإذ بي أرى الكارثة: استهلاك المعالج (CPU) 100%، والذاكرة (RAM) على وشك الامتلاء، وزمن استجابة الطلبات (Response Time) بالثواني وليس بالميللي ثانية. كان عدد المستخدمين النشطين بالكاد تجاوز الـ 100 مستخدم. شعرت بإحباط شديد، كيف لتطبيق سريع جدًا أن ينهار بهذا الشكل؟ هنا كانت الصدمة الأولى، والإدراك بأن “تطبيقي سريع على جهازي” هي واحدة من أكبر الأكاذيب التي نكذبها على أنفسنا كمبرمجين. هذه الحادثة كانت درسي القاسي والمفيد الذي أدخلني بعمق إلى عالم اختبارات الأداء، وتحديدًا “اختبار الحِمل” (Load Testing).

ما هو اختبار الحِمل (Load Testing) وليش هو مهم؟

ببساطة يا جماعة، اختبار الحِمل مش عشان يشوف إذا الكود تبعك شغال أو فيه أخطاء منطقية (Bugs). هداك شغل الـ Unit Tests والـ Integration Tests. اختبار الحِمل بيجاوب على سؤال مختلف تمامًا: “كيف سيتصرف تطبيقي تحت ضغط حقيقي ومتوقع من المستخدمين؟”.

تخيل أنك بتبني جسر. أنت بتختبره بسيارة واحدة، وبيمشي الحال. لكن هل هذا كافي؟ طبعًا لا. لازم تختبره بحمولة شاحنات وسيارات كثيرة في نفس الوقت عشان تتأكد إنه ما راح ينهار وقت الذروة. هذا بالضبط ما يفعله اختبار الحِمل لتطبيقك.

“اختبار الحِمل لا يختبر “ماذا” يفعله نظامك، بل يختبر “كيف” يفعله تحت الضغط.”

الهدف هو محاكاة عدد معين من المستخدمين الافتراضيين (Virtual Users) الذين يستخدمون تطبيقك في نفس الوقت، ومراقبة أداء النظام لتحديد أقصى قدرة له قبل أن يبدأ الأداء في التدهور أو الانهيار.

الفرق بين اختبار الحِمل وأنواع اختبارات الأداء الأخرى

Load Testing (اختبار الحِمل): يقيس الأداء تحت حِمل “متوقع”. مثلاً، تتوقع 1000 مستخدم متزامن في أوقات الذروة، فتختبر النظام بهذا العدد.
Stress Testing (اختبار الإجهاد): يدفع النظام إلى ما بعد طاقته الاستيعابية لتحديد نقطة الانهيار. يعني بدل 1000 مستخدم، بتجرب 2000 أو 3000 عشان تشوف متى وكيف بيفشل النظام.
Spike Testing (اختبار الارتفاع المفاجئ): يحاكي زيادة مفاجئة وكبيرة في عدد المستخدمين، مثل وقت إعلان تسويقي كبير، ثم عودة العدد إلى طبيعته.

في قصتي، كنت بحاجة ماسة إلى اختبار الحِمل لأفهم سلوك تطبيقي تحت ضغط 100 مستخدم فقط!

رحلة الكشف عن “عنق الزجاجة” (The Bottleneck)

بعد الصدمة الأولى، قررت أتعامل مع الموضوع بشكل منهجي. الخطوة الأولى كانت اختيار أداة مناسبة لعمل اختبار الحِمل. في خيارين مشهورين جدًا في السوق:

Apache JMeter: أداة قوية جدًا، مفتوحة المصدر، مبنية بالجافا. فيها واجهة رسومية (GUI) بتسهل بناء خطط الاختبار المعقدة. لكنها ممكن تكون ثقيلة على الموارد شوي.
k6 (by Grafana Labs): أداة أحدث، مكتوبة بلغة Go، وتستخدم JavaScript/TypeScript لكتابة سكربتات الاختبار. خفيفة جدًا على الموارد، وموجهة للمطورين (Developer-friendly) لأنها بتعتمد على الكود.

بحكم خلفيتي كمطور وحبي للكود، اخترت أبدأ مع k6 لسهولته وسرعته.

الخطوة الأولى: كتابة سكربت اختبار بسيط بـ k6

الهدف كان محاكاة مستخدمين يزورون الصفحة الرئيسية لتطبيق “جدولي”. السكربت كان بسيطًا جدًا:


import http from 'k6/http';
import { sleep } from 'k6';

// هذا هو إعداد الاختبار
export const options = {
  // المراحل: زيادة تدريجية للمستخدمين
  stages: [
    { duration: '30s', target: 50 },   // زيادة إلى 50 مستخدم خلال 30 ثانية
    { duration: '1m', target: 100 },  // زيادة إلى 100 مستخدم خلال دقيقة
    { duration: '30s', target: 0 },    // العودة إلى 0 مستخدم
  ],
  // شروط النجاح: إذا فشل أكثر من 1% من الطلبات، أو كان p95 أعلى من 500ms، اعتبر الاختبار فاشلاً
  thresholds: {
    'http_req_failed': ['rate<0.01'], // معدل الفشل أقل من 1%
    'http_req_duration': ['p(95)<500'], // 95% من الطلبات يجب أن تكون أسرع من 500ms
  },
};

// هذا هو الكود الذي سينفذه كل مستخدم افتراضي
export default function () {
  // طلب GET للصفحة الرئيسية
  http.get('https://api.jidwali.app/tasks');

  // انتظار عشوائي بين 1 و 3 ثواني لمحاكاة سلوك المستخدم
  sleep(Math.random() * 2 + 1); 
}

شرح بسيط للكود:

options: هنا نحدد سيناريو الاختبار. في حالتي، طلبت من k6 أن يزيد عدد المستخدمين الافتراضيين (VUs) تدريجيًا إلى 100 مستخدم.
thresholds: هذه أهم جزئية. هنا أضع “شروط النجاح”. قلت له إن الاختبار يعتبر فاشلاً إذا كان معدل الطلبات الفاشلة أكثر من 1%، أو إذا كان زمن استجابة 95% من الطلبات (p95) أبطأ من 500 ميللي ثانية.
export default function (): هذا هو قلب السكربت. كل مستخدم افتراضي سيقوم بتنفيذ هذا الكود بشكل متكرر: يطلب الصفحة الرئيسية وينتظر قليلاً.

الخطوة الثانية: تشغيل الاختبار ورؤية الحقيقة المرة

شغلت الاختبار، وفي ثوانٍ بدأت الأرقام تظهر على الشاشة. كانت النتائج صادمة ومطابقة تمامًا لما حدث في الواقع:

عندما كان عدد المستخدمين 50، كان متوسط زمن الاستجابة حوالي 400ms (مقبول لكن على الحافة).
بمجرد أن بدأ العدد يقترب من 100، قفز زمن الاستجابة إلى 3500ms (3.5 ثوانٍ!).
معدل الطلبات الفاشلة (http_req_failed) بدأ يرتفع.
شرط النجاح p(95)<500 فشل فشلاً ذريعًا.

الآن، أصبح لدي دليل رقمي على المشكلة. لم يعد الأمر مجرد “شعور” بأن التطبيق بطيء، بل أرقام وبيانات تثبت وجود عنق زجاجة حقيقي.

الخطوة الثالثة: تحديد مكان “عنق الزجاجة”

مع وجود البيانات، بدأت رحلة البحث. عنق الزجاجة في تطبيقات الويب غالبًا ما يكون في أحد هذه الأماكن:

قاعدة البيانات (Database): استعلامات بطيئة،缺少 فهارس (indexes)، اتصالات كثيرة.
الكود البرمجي للتطبيق (Application Code): خوارزميات غير فعالة، استدعاءات متكررة للـ API، مشكلة N+1.
البنية التحتية (Infrastructure): سيرفر ضعيف (CPU/RAM)، إعدادات خاطئة لخادم الويب (Nginx/Apache).

بما أن استهلاك المعالج كان 100%، شككت فورًا في قاعدة البيانات. فتحت سجلات الاستعلامات البطيئة (Slow Query Log) في قاعدة بياناتي (كانت PostgreSQL وقتها)، وهنا كانت المفاجأة الكبرى.

وجدت أن استعلامًا واحدًا، مسؤول عن جلب المهام للمستخدم، كان يتكرر مع كل طلب للصفحة الرئيسية، وكان يستغرق وقتًا طويلاً جدًا كلما زاد عدد الصفوف في جدول المهام. المشكلة كانت أنه يقوم بعملية “Full Table Scan”، أي أنه يمر على كل السجلات في الجدول ليبحث عن مهام المستخدم الحالي.

السبب؟ ببساطة، كنت ناسي أضيف فهرس (Index) على عمود user_id في جدول tasks!

الحل كان بسيطًا بشكل يبعث على الضحك (والبكاء بنفس الوقت):


-- إضافة فهرس لعمود `user_id` في جدول `tasks`
CREATE INDEX idx_tasks_user_id ON tasks(user_id);

هذا السطر الواحد يخبر قاعدة البيانات أن تنشئ هيكل بيانات سريع للبحث عن طريق user_id، بدلاً من مسح الجدول بأكمله في كل مرة.

الخطوة الرابعة: إعادة الاختبار والشعور بالنصر 🚀

بعد إضافة الفهرس، قمت بإعادة تشغيل نفس سكربت k6 بالضبط. النتيجة؟ كانت كالليل والنهار.

عند 100 مستخدم متزامن، كان متوسط زمن الاستجابة أقل من 80ms.
معدل الطلبات الفاشلة: 0%.
استهلاك المعالج على السيرفر بالكاد تجاوز 20%.
جميع شروط النجاح (Thresholds) تم تحقيقها بنجاح باهر.

كان شعورًا رائعًا. لم أقم بتغيير أي سطر في كود التطبيق نفسه، بل مجرد تحسين بسيط في قاعدة البيانات كشفه لي اختبار الحِمل، وهذا التحسين أنقذ التطبيق من فشل محقق.

نصائح أبو عمر الذهبية في اختبارات الأداء

من خلال هذه التجربة وغيرها، تعلمت دروسًا غالية، وأحب أشارككم بعضها:

💡 ابدأ مبكرًا وبسيطًا: لا تنتظر حتى قبل الإطلاق بأسبوع لتبدأ اختبار الأداء. اكتب سكربت بسيط مثل الذي عرضته واجعله جزءًا من روتينك.
⚠️ لا تختبر على بيئة الإنتاج (Production) مباشرةً: هذا خطأ قاتل. قم بإنشاء بيئة مطابقة للإنتاج قدر الإمكان (Staging Environment) وقم بإجراء اختباراتك عليها.
📊 اعرف مقاييسك (Know Your Metrics): ما هو زمن الاستجابة المقبول لتطبيقك؟ 200ms؟ 500ms؟ حدد أهدافك (SLOs – Service Level Objectives) واكتبها في thresholds الخاصة بك.
🤖 الأتمتة هي المفتاح (Automation is Key): أفضل شيء هو دمج اختبارات الحِمل في مسار الـ CI/CD الخاص بك. مثلاً، يمكنك تشغيل اختبار حِمل صغير كل ليلة على بيئة الـ Staging وإرسال تقرير تلقائي.
🧠 الأداة مجرد وسيلة: تعلم k6 أو JMeter ممتاز، لكن الأهم هو فهم كيفية تحليل النتائج وربطها بالمشاكل الحقيقية في نظامك. ركز على فهم المقاييس مثل p95, p99, ومعدلات الفشل.

الخلاصة: من مبرمج قلق إلى مهندس واثق ✅

تجربة “جدولي” علمتني أن بناء تطبيق “شغّال” هو نصف الطريق فقط. النصف الآخر، والأكثر أهمية لنجاح أي منتج، هو بناء تطبيق “موثوق” (Reliable) وقادر على الصمود. اختبار الحِمل لم يكن مجرد خطوة تقنية، بل كان نقلة نوعية في طريقة تفكيري، حوّلني من مبرمج يثق بـ “إنها تعمل على جهازي” إلى مهندس يفكر في الضغط، والسعة، وتجربة المستخدم النهائي تحت أي ظرف.

لا تخف من اختبار تطبيقك. بالعكس، كن أنت أول من يكتشف نقاط ضعفه ويقسو عليه في بيئة الاختبار، حتى يكون لطيفًا وسريعًا مع مستخدميك في العالم الحقيقي. هذا هو الفرق بين “شغل نظيف” ومنتج ينهار عند أول اختبار حقيقي.

أتمنى لكم كل التوفيق في مشاريعكم، ولا تنسوا تختبروا أحمالكم!

الوسوم:

شارك المقال:

سجل دخولك لعمل نقاش تفاعلي

كافة المحادثات خاصة ولا يتم عرضها على الموقع نهائياً

آراء من النقاشات

لا توجد آراء منشورة بعد. كن أول من يشارك رأيه!

اختبارات الاداء والجودة

كنا نكتشف نقاط ضعفنا في الكوارث فقط: كيف أنقذتنا ‘هندسة الفوضى’ من جحيم ‘التعافي بعد فوات الأوان’؟

من قلب تجربة مؤلمة في إحدى ليالي إطلاق المنتجات، أشارككم كيف انتقلنا من إطفاء الحرائق إلى بناء أنظمة قوية تتحمل الصدمات. هذه ليست مجرد مقالة...

26 أبريل، 2026 قراءة المزيد

اختبارات الاداء والجودة

تطبيقي كان يعمل كالساعة… حتى زاره 100 مستخدم: كيف أنقذني ‘اختبار الحمل’ (Load Testing) من جحيم الأعطال؟

أشارككم قصة حقيقية من تجربتي كمطور وكيف أنقذني اختبار الحمل (Load Testing) من فشل ذريع عند إطلاق أحد تطبيقاتي. سنتعلم معًا ما هو هذا الاختبار،...

29 مارس، 2026 قراءة المزيد

اختبارات الاداء والجودة

كانت تغطية الكود 100% لكن الأخطاء تتسلل: كيف أنقذنا ‘الاختبار الطفري’ من جحيم الثقة الزائفة؟

كنا نحتفل بتغطية اختبارات بنسبة 100%، لكن الأخطاء استمرت بالظهور في بيئة الإنتاج. هذه قصتي مع "الاختبار الطفري" (Mutation Testing)، الأداة التي كشفت لنا حقيقة...

7 مايو، 2026 قراءة المزيد

اختبارات الاداء والجودة

الاختبار الطفري (Mutation Testing): كيف تقتل الثقة الزائفة في اختباراتك البرمجية؟

كنا نظن أن تغطية اختبارات بنسبة 100% هي درعنا الحصين، لكن الأخطاء كانت تتسلل إلى الإنتاج. في هذه المقالة، أشارككم قصة كيف أنقذنا "الاختبار الطفري"...

3 يونيو، 2026 قراءة المزيد

اختبارات الاداء والجودة

كنا ننتظر الكارثة لتقع: كيف أنقذتنا ‘هندسة الفوضى’ (Chaos Engineering) من جحيم الأعطال غير المتوقعة؟

أشارككم قصة حقيقية عن عطل كاد أن يدمر إطلاق منتج مهم، وكيف أن مفهوم "هندسة الفوضى" ليس مجرد تخريب، بل هو اللقاح الذي تحتاجه أنظمتك...

3 مايو، 2026 قراءة المزيد

اختبارات الاداء والجودة

اختبار الطفرات: من وهم الـ 100% تغطية إلى جودة الكود الحقيقية

كنا نظن أن تغطية اختباراتنا البالغة 100% هي درعنا الحصين، حتى انهار كل شيء في لحظة. هذه قصتي مع "اختبار الطفرات" (Mutation Testing)، التقنية التي...

20 مايو، 2026 قراءة المزيد

اختبارات الاداء والجودة

تغطية 100% وكود هش: كيف أنقذنا “الاختبار الطفري” من جحيم الثقة الزائفة؟

كانت مقاييس تغطية الكود في مشروعنا تشير إلى 100%، لكننا كنا نعيش كابوسًا من الأخطاء غير المتوقعة. هذه قصة كيف أنقذنا الاختبار الطفري (Mutation Testing)...

31 مايو، 2026 قراءة المزيد

اختبارات الاداء والجودة

اختباراتنا كانت تجتاز والموقع ينهار: كيف أنقذنا ‘اختبار الحمل بالسيناريوهات الواقعية’ (k6) من جحيم الأداء الوهمي؟

كانت كل اختبارات الأداء لدينا تظهر نتائج ممتازة، لكن الموقع كان ينهار مع أولى موجات المستخدمين الحقيقيين. هذه المقالة هي قصتنا مع "الأداء الوهمي"، وكيف...

16 أبريل، 2026 قراءة المزيد

اختبارات الاداء والجودة

كنا ننتظر الكارثة لتقع: كيف أنقذتنا ‘هندسة الفوضى’ من جحيم الثقة العمياء في أنظمتنا؟

من قلب تجربتي كمبرمج، أسرد لكم قصة تلك الليلة التي كاد فيها نظامنا أن ينهار، وكيف كانت "هندسة الفوضى" (Chaos Engineering) هي طوق النجاة الذي...

15 أبريل، 2026 قراءة المزيد

آخر المدونات

برمجة وقواعد بيانات

تحديثات قاعدة البيانات بدون توقف: كيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من جحيم التوقفات المجدولة؟

هل سئمت من إيقاف الخدمة مع كل تحديث لهيكلة قاعدة البيانات؟ أشارككم قصة حقيقية وكيف أنقذنا نمط التوسيع والتعاقد (Expand/Contract) من ليالي النشر الطويلة والمُجهدة،...

4 يونيو، 2026 قراءة المزيد

الشبكات والـ APIs

كانت إعادة المحاولة كارثة: كيف أنقذتنا مفاتيح عدم تكرار العمليات (Idempotency Keys) من جحيم الفواتير المزدوجة؟

أشارككم قصة حقيقية من الخنادق البرمجية، يوم كاد خطأ بسيط في إعادة محاولة طلبات الدفع أن يكلفنا سمعتنا وأموال عملائنا. اكتشفوا معنا كيف كانت مفاتيح...

4 يونيو، 2026 قراءة المزيد

التوظيف وبناء الهوية التقنية

كانت مهمتي البرمجية للاختبار مجرد كود: كيف أنقذني توثيق القرارات من جحيم الصمت بعد المقابلة؟

أشارككم قصة حقيقية من بداياتي، وكيف تعلمت بالطريقة الصعبة أن المهمة البرمجية ليست مجرد كتابة كود، بل هي فرصة لإظهار طريقة تفكيرك. اكتشف كيف يمكن...

4 يونيو، 2026 قراءة المزيد

التوسع والأداء العالي والأحمال

نمط قاطع الدائرة: كيف نجا نظامنا من جحيم الانهيارات المتسلسلة؟

أشارككم قصة حقيقية من قلب المعركة البرمجية، كيف تحول فشل بسيط في إحدى الخدمات إلى انهيار كارثي للنظام بأكمله. واكتشفوا معنا نمط "قاطع الدائرة" (Circuit...

4 يونيو، 2026 قراءة المزيد