امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

تم تحديد سبب تعطل Cloudflare، واعتذر CTO: تسبب حجم ملف التكوين الكبير في حدوث أعطال متتالية، لن يتكرر ذلك.

في 19 نوفمبر 2025، أصدرت شركة Cloudflare بيانًا رسميًا، مؤكدة أن انقطاع الخدمة العالمي الذي حدث في اليوم السابق ناتج عن فشل متسلسل ناجم عن تجاوز حجم ملف تكوين معين للحجم المتوقع. تم إنشاء هذا الملف تلقائيًا لإدارة نظام تكوين حركة المرور المتعلقة بالتهديدات، وعندما تجاوز عدد مدخلاته الحجم المتوقع، أدى ذلك إلى انهيار نظام معالجة حركة المرور لبعض خدمات Cloudflare.

وفقًا لتقرير بلومبرغ، بدأت هذه الانقطاع في الساعة 6:20 صباحًا بتوقيت نيويورك واستمرت لمدة تقارب الأربع ساعات، مما أثر على آلاف المواقع العالمية بدءًا من X وصولًا إلى ChatGPT، كما لم تنجُ مواقع الجهات الرئيسية لتنظيم الطاقة في الولايات المتحدة وهيئة النقل في نيوجيرسي. وقد اعتذر داين كنيشت، المدير الفني لشركة Cloudflare، علنًا، وأفاد بأن العمل جارٍ لضمان عدم حدوث مثل هذه الحوادث مرة أخرى.

أسباب وتعليمات عطل Cloudflare

وفقًا لبيان المتحدثة باسم Cloudflare جاكي داتون، فإن السبب الجذري لهذه الانقطاع العالمي للخدمات يشير إلى مشكلة تقنية تبدو عادية - وهي حجم ملف التكوين الكبير. هذا الملف التلقائي الذي يتم إنشاؤه لإدارة حركة التهديدات، وعندما يتجاوز عدد إدخالاته الحجم المتوقع، يؤدي إلى انهيار نظام البرمجيات الذي يعالج جزءًا من حركة خدمات Cloudflare. هذه الفشل الناتج عن قيود تخصيص الموارد يكشف أنه حتى أكثر البنى التحتية التقنية نضوجًا، تعاني من نقاط ضعف أساسية.

من منظور هيكلية التقنية، تعكس هذه النمط من الأعطال تعقيد بنية الإنترنت الحديثة. تُعتبر ملفات التكوين كجزء أساسي من تشغيل النظام، وغالبًا ما يُنظر إلى إدارتها على أنها مهمة تشغيلية روتينية، ولكن عندما تتجاوز حجمها القدرة التصميمية للنظام، قد يتسبب ذلك في ردود فعل متسلسلة. قد تكون “ذروة المرور غير العادية” التي لاحظتها Cloudflare هي المحفز المباشر لتضخم ملفات التكوين بشكل سريع، لكن السبب الجذري يكمن في ضعف تصميم مرونة النظام لمثل هذه الحالات الشاذة. كما كشفت هذه الحادثة عن الحاجة إلى مراقبة وتدخل بشري في جودة وتحكم حجم المحتوى الذي يتم إنشاؤه تلقائيًا في عصر تزايد انتشار الأنظمة الآلية.

نطاق تأثير تعطل Cloudflare واستجابة الطوارئ

أثر تعطل الخدمة هذا يمتد من عمالقة التكنولوجيا إلى البنية التحتية الحيوية، مما يظهر الأهمية النظامية لـ Cloudflare في النظام البيئي الحديث للإنترنت. أكدت شركة الذكاء الاصطناعي Anthropic PBC أن خدمة روبوت الدردشة Claude AI الخاصة بها تأثرت، كما تعرض موقع لجنة تنظيم الطاقة الفيدرالية الأمريكية (FERC) لانقطاع، وهو منصة حيوية للعديد من الشركات والمحامين والهيئات التنظيمية للوصول إلى القضايا والملفات التنظيمية.

لم ينجُ نظام النقل من هذه المشكلة أيضًا. أكد متحدث باسم هيئة النقل في متروبوليتان (MTA) أن نظام النقل في مدينة نيويورك تأثر بانقطاع Cloudflare، حيث حثت الهيئة الركاب على استخدام تطبيقها MTAapp أو TrainTime للحصول على حالة النقل الحية وتخطيط الرحلات. كما أشار مكتب النقل في نيوجيرسي إلى أن موقعه الإلكتروني وتطبيقه المحمول قد تأثرا، وحذر من أن الخدمة قد تكون غير متاحة مؤقتًا أو تعمل ببطء. تسلط هذه السلسلة من ردود الفعل على البنية التحتية الحيوية الضوء على المخاطر النظامية للخدمات المركزية على الإنترنت.

الجدول الزمني الرئيسي لحدث تعطل Cloudflare

بدء العطل: تم ملاحظة ذروة تدفق غير عادية في الساعة 6:20 صباحًا بتوقيت نيويورك

نطاق التأثير: X، ChatGPT، Claude AI، FERC، نظام النقل في نيويورك ونيوجيرسي وغيرها

مدة: انقطاع الخدمة الشامل لمدة تقارب 4 ساعات

السبب الجذري: أدى تجاوز حجم ملف تكوين إدارة التهديدات المتوقع إلى تعطل النظام

سجل التاريخ: في يوليو 2019، أدى خلل البرمجيات إلى انقطاع لمدة 30 دقيقة، وفي يونيو 2022، تعطلت 19 مركز بيانات لمدة 1.5 ساعة.

تحليل الأنماط وإعادة ترتيب الأحداث التاريخية

لم تكن هذه هي المرة الأولى التي تتعرض فيها Cloudflare لانقطاع كبير في الخدمة. عند النظر إلى يوليو 2019، أدى عطل في برنامج Cloudflare إلى استنفاد جزء من الشبكة لجميع موارد الحوسبة في الشركة، مما جعل الآلاف من المواقع العالمية، بما في ذلك Discord و Shopify و SoundCloud وبعض منصات CEX الرئيسية، غير متصلة لمدة تصل إلى 30 دقيقة. في يونيو 2022، حدث عطل آخر في Cloudflare، أثر على حركة المرور في 19 من مراكز البيانات الخاصة بها، مما أغلق فعليًا المواقع والخدمات الرئيسية، واستمر الحادث لمدة ساعة ونصف تقريبًا.

عند تحليل هذه الأحداث جنبا إلى جنب مع انقطاع خدمات أمازون AWS الذي استمر حوالي 15 ساعة مؤخرا، يمكن ملاحظة نمط مقلق: الاعتماد العالمي على عدد قليل من مزودي البنية التحتية يخلق مخاطر نظامية. علق ألان وودوارد، أستاذ الأمن السيبراني في جامعة ساري، على أن فترة التوقف يوم الثلاثاء هي أحدث مثال على اعتماد الإنترنت على “عدد قليل نسبيا من المشاركين”، ووصف Cloudflare بأنها “أكبر شركة لم تسمع عنها من قبل”.

استجابة الشركات وإعادة بناء الثقة

اعتذر داني كنيشت، كبير مسؤولي التكنولوجيا في Cloudflare، في منشور على X حول هذه الحادثة، حيث قال: “كانت المشكلة وتأثيرها ومدة الحل غير مقبولة. العمل جارٍ لضمان عدم حدوث ذلك مرة أخرى، لكنني أعلم أن ذلك تسبب في معاناة حقيقية اليوم. ثقة العملاء بنا هي ما نعتبره الأكثر أهمية، وسنبذل قصارى جهدنا لاستعادة هذه الثقة.”

إن هذا الاعتراف المباشر بالخطأ والتعهد بتحسين الأمور هو أمر بالغ الأهمية للحفاظ على ثقة العملاء. من وجهة نظر إدارة التقنية، تشمل الإجراءات القياسية بعد مثل هذه الحوادث تحليل السبب الجذري، وإعادة تقييم تخطيط السعة، وتعزيز نظام المراقبة، واختبار إجراءات استعادة الأعطال. نظرًا لأن برنامج Cloudflare يستخدمه مئات الآلاف من الشركات في جميع أنحاء العالم كوسيلة عازلة بين مواقعها والمستخدمين النهائيين وملتزم بحماية مواقعها من هجمات المرور المحتملة التي قد تؤدي إلى تحميلها بشكل زائد، فإن استقرار نظامه له تأثير مباشر على الصحة العامة للإنترنت.

تأملات الصناعة ومبادرات اللامركزية

أشعلت هذه الحادثة من الانقطاع النقاش حول اعتماد شبكة البنية التحتية الفيزيائية اللامركزية (DePIN) مرة أخرى. دعا بعض العاملين في صناعة التشفير إلى اعتماد أوسع لـ DePIN للتعامل مع مثل هذه المشكلات، حيث تستخدم هذه الشبكة حوافز البلوكشين لتنسيق ومكافأة الناس على بناء وصيانة البنية التحتية في العالم الحقيقي، لإنشاء طبقة بنية تحتية مفتوحة تديرها المجتمع، مما يتجنب الاعتماد على الشركات المركزية.

قال نوقفي دان إليداسون، الرئيس التنفيذي لمشروع Gaimin الذي يركز على بنية تحتية سحابية موزعة، “يجب علينا التحول إلى نموذج سحابي موزع حقيقي. من خلال الاستفادة من الموارد العالمية الموزعة الحالية (مثل أجهزة الكمبيوتر التي لم يتم استغلالها بشكل كامل)، تقوم Gaimin ببناء شبكة تتوزع سعتها عبر مناطق وقارات مختلفة، مما يجعل من الصعب على خطأ واحد أن ينهار النظام العالمي بأسره. هذه هي الطريقة الوحيدة لحماية الاقتصاد الرقمي من التأثيرات الضعيفة الموروثة عن المركزية.”

تحليل مخاطر المركزية في البنية التحتية

تشير وجهة نظر البروفيسور وودوارد إلى جوهر المشكلة: “ليس أمام الناس خيار سوى الاعتماد على عدد قليل من الشركات الكبيرة نسبياً.” هذا الاعتماد يخلق مخاطر نقطة فشل واحدة، وعندما تواجه هذه الجهات الفاعلة الرئيسية مشاكل، فإن التأثير سيتجاوز الصناعة وينتشر. من Cloudflare إلى Amazon AWS وCrowdStrike وMicrosoft، سلطت سلسلة من أحداث الانقطاع في السنوات الأخيرة الضوء على الطبيعة المترابطة للنظام البيئي الرقمي.

إن مقارنة أنواع مختلفة من الانقطاعات تكون ملهمة للغاية. في العام الماضي، تسببت تحديثات البرامج المعيبة لشركة CrowdStrike Holdings Inc. في تعطل ملايين الأجهزة التي تعمل بنظام Windows من Microsoft Corp، مما أدى إلى اضطراب في صناعة السفر الجوي والمصارف والرعاية الصحية وغيرها من الصناعات. كانت الانقطاعات التي حدثت في CrowdStrike ناتجة عن خلل في المنتج يعمل في أعمق مستويات أجهزة الكمبيوتر الخاصة بالعملاء. بالمقابل، تحمي Cloudflare البنية التحتية للإنترنت مثل المواقع والمنصات، ولهذا السبب فإن العديد من المواقع الشهيرة تتعطل أو تكون غير موثوقة خلال انقطاع Cloudflare.

لم يتوقع مهندسو Cloudflare على الأرجح أن ضعف الإنترنت لا يكمن فقط في أعماق الشيفرة، بل يكمن أيضًا في البنية التحتية المفرطة المركزية - كل انهيار لخدمة مركزية يمنح صوتًا إيجابيًا لمستقبل اللامركزية. من مترو نيويورك إلى روبوتات الدردشة بالذكاء الاصطناعي، يبدو أن تشغيل المجتمع الحديث يعتمد بشدة على استقرار عدد قليل من شركات التكنولوجيا، وهذا الاكتشاف أكثر إثارة للتفكير من أي خلل بحد ذاته.

الأسئلة المتكررة

ما هو السبب الجذري لانقطاع خدمة Cloudflare عالميًا؟

تسبب تجاوز الحجم المتوقع لملف التكوين الذي تم إنشاؤه تلقائيًا لإدارة حركة المرور المهددة في تعطل نظام البرمجيات الذي يعالج جزءًا من حركة المرور عندما يتجاوز عدد إدخالات الملف الحد.

ما هي الخدمات الهامة التي تأثرت بهذه الانقطاعات؟

تشمل نطاق التأثير منصات التكنولوجيا مثل X وChatGPT وClaude AI، فضلاً عن البنية التحتية الحيوية مثل لجنة تنظيم الطاقة الفيدرالية الأمريكية ونظام النقل في نيويورك ونيوجيرسي.

هل لدى Cloudflare تاريخ مشابه من الانقطاعات؟

في يوليو 2019، تسبب خلل برمجي في تعطل المواقع العالمية لمدة 30 دقيقة، وفي يونيو 2022، أدت أعطال في 19 مركز بيانات إلى انقطاع الخدمة لمدة حوالي ساعة ونصف، مما يظهر أن المخاطر النظامية لا تزال موجودة.

ما هي خطط الصناعة للتعامل مع هذه الأنواع من الأحداث؟

تم اقتراح خطة DePIN (شبكة البنية التحتية الفيزيائية اللامركزية) من خلال تحفيز البلوكشين لبناء بنية تحتية موزعة، مما يقلل من الاعتماد على مقدمي الخدمات المركزيين.

كيف ردت Cloudflare الرسمية على هذا الحدث؟

اعتذر المدير الفني داني كنيشت علنًا ، معترفًا بأن تأثير المشكلة ووقت الحل غير مقبول ، وأشار إلى أن العمل جارٍ لضمان عدم حدوث مثل هذه الحوادث مرة أخرى.

GMRX-4.27%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت