
شاشة عرض Cloudflare على الهاتف. الصورة: الإنترنت.
"تعطس" شركة كلاود فلير، ويصاب الإنترنت "بنزلة برد".
مساء يوم 18 نوفمبر (بتوقيت هانوي)، واجه المستخدمون في فيتنام والعديد من المناطق الأخرى حول العالم صعوبات في الوصول إلى عدد من المنصات الرئيسية. لم يكن سبب هذا الحادث الخطير هجومًا إلكترونيًا متطورًا، بل ملف إعدادات تم إنشاؤه تلقائيًا في النظام.
تُعدّ Cloudflare بمثابة "بوابة" وسيطة بالغة الأهمية بين المستخدمين وخوادم المواقع الإلكترونية. تُقدّم الشركة العديد من الخدمات الحيوية، بما في ذلك شبكة توصيل المحتوى (CDN) لتسريع تحميل الصفحات والحماية من هجمات DDoS، وخدمات نظام أسماء النطاقات (DNS) لربط الشبكات بعناوين IP الصحيحة. وبمعدل 81 مليون طلب HTTP في الثانية، فإنّ أي عطل في أنظمة Cloudflare يُؤدّي إلى تأثير فوري وواسع النطاق.
تعطلت العديد من الخدمات الرئيسية، بما في ذلك X (تويتر سابقًا)، وChatGPT، وCanva، وGrindr، وSpotify، وOpenAI، وClaude. وظهرت للمستخدمين بشكل متكرر رسائل "500 خطأ داخلي في الخادم" أو طلبات لإعادة المحاولة بعد بضع دقائق، مما يشير مباشرةً إلى وجود أخطاء داخلية في خادم شبكة Cloudflare. وسجل موقع Downdetector أكثر من 11,000 بلاغ من المستخدمين في ذروة المشكلة، قبل أن ينخفض العدد إلى 2,800 بلاغ مع قيام Cloudflare بتطبيق التحديثات.
كشف عطل فني واسع النطاق في شركة كلاود فلير - وهي شركة بنية تحتية تُدير ما يقارب 20% من حركة مرور الإنترنت العالمية - عن هشاشة الإنترنت الحديث. وعلق الخبراء قائلين: "عندما تعطس كلاود فلير، يُصاب الإنترنت بالزكام".
السبب هو ملف تكوين كبير الحجم.
بدأ الحادث حوالي الساعة 12:00 بالتوقيت العالمي المنسق. وأكدت شركة كلاود فلير لاحقًا أن السبب الرئيسي هو ملف تكوين تم إنشاؤه تلقائيًا مصمم لإدارة حركة المرور الضارة. تجاوز حجم هذا الملف الحجم المخصص له، مما أدى إلى حدوث خلل في نظام معالجة حركة المرور للعديد من خدمات كلاود فلير.
أشار روب لي، مدير قسم الذكاء الاصطناعي والأبحاث في معهد SANS، إلى أنه عند تشغيل بنية تحتية بحجم Cloudflare، حتى أدنى تغيير في الطور قد يكون له عواقب وخيمة. وقال لي: "في بيئة عالية الأداء، يمكن أن يصبح تأخير جزء من الألف من الثانية نقطة اختناق لتدفق البيانات بأكمله".
يُحدد ملف التكوين هذا سياسات التوجيه، ويُحدد موازنة الأحمال، وكيفية توزيع حركة البيانات العالمية. قد تؤدي الزيادة المفاجئة في حجمه إلى إبطاء التحليل، أو حدوث أخطاء في الذاكرة، أو التسبب في ازدحام وحدة المعالجة المركزية، أو إتلاف منطق الأنظمة التي تعتمد عليه.
أقرت شركة كلاود فلير سريعاً بالمشكلة، واصفةً إياها بخطأ 500 واسع الانتشار عبر الشبكة. كما أكدت الشركة أنه "لا يوجد دليل على أن هذا كان نتيجة لهجوم".
خسائر مالية بمليارات الدولارات.
لم تقتصر عواقب الحادث على إحباط المستخدمين فحسب، بل انخفضت أسهم الشركة بنسبة 2.3% في تداولات الصباح عقب الحادث، أي ما يعادل خسارة فورية لنحو 1.8 مليار دولار من قيمتها السوقية.
كانت اتفاقيات مستوى الخدمة (SLAs) في صميم الأزمة المالية. فمع توقف الخدمة الأساسية لمدة 90 دقيقة تقريبًا، كانت شركة كلاود فلير ملزمة بتعويض عملائها. وقد أدت هذه الأعطال التقنية إلى تآكل الإيرادات بشكل مباشر. وأظهرت دراسة في هذا القطاع أن كل ساعة من التوقف قد تكلف شركة تقنية متوسطة الحجم ما متوسطه 300 ألف دولار. وإذا ضربنا هذا الرقم في عدد عملاء كلاود فلير الذي يتجاوز 300 ألف عميل - بما في ذلك شركات عملاقة مثل أوبن إيه آي وجوجل - فإن العواقب قد تصل إلى عشرات الملايين من الدولارات في حادثة واحدة.
علاوة على ذلك، وقع هذا الحادث بالتحديد في وقت كانت فيه شركة كلاود فلير تُوسّع نطاق خدمات الذكاء الاصطناعي مثل Workers AI، التي تتطلب استقرارًا شبه مطلق. إن أي "خلل" بسيط لن يؤدي فقط إلى خسارة التعويضات، بل سيؤدي أيضًا إلى تباطؤ نمو سوق الذكاء الاصطناعي، الذي يُتوقع أن تصل قيمته إلى 100 مليار دولار بحلول عام 2028.
دروس حول هشاشة الإنترنت
لا يزال انقطاع خدمة كلاود فلير بمثابة جرس إنذار بشأن هشاشة الإنترنت. وهذا هو ثاني حادث كبير في البنية التحتية خلال شهر واحد فقط، بعد انقطاع خدمة أمازون ويب سيرفيسز (AWS) في أكتوبر.
يشعر الخبراء بالقلق إزاء النموذج المركزي، حيث يتم بناء الإنترنت الحديث على عدد قليل من "نقاط الفشل الفردية". فعندما تتعطل نقاط الضعف مثل Cloudflare أو AWS أو Google Cloud، سيتوقف النظام البيئي بأكمله.
صرحت ميريديث ويتاكر، رئيسة شركة سيجنال، ذات مرة بأن الخدمة "لم يكن أمامها خيار آخر" سوى الاعتماد على مزودي الخدمة الرئيسيين. تكمن المشكلة في هذا الاعتماد. تبني الشركات عملياتها التجارية على افتراض توفر الخدمة بنسبة 99.9%، ثم تُصدم عندما تواجه نسبة فشل لا تتجاوز 0.1%.
يتفاقم هذا الاعتماد عندما تدمج الشركات الذكاء الاصطناعي في سير العمل الأساسي (دعم العملاء، إنتاج المحتوى). فعندما تتعطل أنظمة الذكاء الاصطناعي المساعدة، تفتقر معظم الشركات إلى خطط طوارئ، لأنها أوكلت مهامًا معرفية إلى أنظمة لا تتحكم بها، وعلى بنية تحتية لا تملكها.
تلتزم شركة Cloudflare بإجراء تحقيقات شاملة وتحديثات للأنظمة الحيوية، لكن هذا الحادث بمثابة تذكير مكلف: "البنية التحتية الحيوية التي تحتوي على نقطة فشل واحدة هي كارثة تنتظر ملف تكوين مناسب".
هين ثاو (مُجمّع)
المصدر: https://doanhnghiepvn.vn/cong-nghe/cloudflare-va-cu-hat-xi-lam-bay-hoi-hang-ty-usd/20251119051528023






تعليق (0)