Скануйте, щоб завантажити додаток Gate
qrCode
Більше варіантів завантаження
Не нагадувати сьогодні

Встановлено причину збоїв Cloudflare, вибачення CTO: надмірний розмір конфігураційного файлу спричинив ланцюгові збої, це не повториться

19 листопада 2025 року компанія Cloudflare опублікувала офіційну заяву, в якій підтвердила, що глобальне переривання послуг, яке сталося напередодні, було викликане каскадним збоям через те, що один з профілів перевищив очікуваний розмір. Цей файл автоматично генерується для управління системою конфігурації загрозового трафіку, і коли кількість його записів перевищує очікуваний обсяг, це призводить до збою в обробці частини програмного забезпечення для обробки трафіку компанії Cloudflare.

Згідно з повідомленнями Bloomberg, ця аварія почалася о 6:20 ранку за нью-йоркським часом і тривала майже чотири години, вплинувши на тисячі глобальних веб-сайтів, від X до ChatGPT. Веб-сайти основних енергетичних регуляторів США та Департаменту транспорту Нью-Джерсі також не уникли цього. Технічний директор Cloudflare Дейн Кнехт публічно вибачився і заявив, що робота триває, щоб забезпечити, що такі події більше не повторяться.

Причини збою Cloudflare та технічні деталі

Згідно зі словами представника Cloudflare Джеки Даттон, основною причиною глобальної перерви в обслуговуванні є, здавалося б, звичайна технічна проблема — занадто великий профіль конфігурації. Цей автоматично згенерований профіль, який використовується для управління загрозами трафіку, викликав збій програмного забезпечення, що обробляє частину трафіку Cloudflare, коли кількість його записів перевищила очікуваний обсяг. Цей збій, спричинений обмеженнями ресурсів, виявляє, що навіть у найрозвиненіших технологічних інфраструктурах існують вразливості на базовому рівні.

З точки зору технічної архітектури, цей режим відмови відображає складність сучасної інтернет-інфраструктури. Конфігураційні файли, як основна частина роботи системи, зазвичай вважаються рутинним завданням з управління масштабом, але коли їх обсяг перевищує проектну ємність системи, це може викликати ланцюгову реакцію. “Аномальні піки трафіку”, зафіксовані Cloudflare, можуть бути безпосередньою причиною різкого розширення конфігураційних файлів, але основна причина полягає в недостатньому еластичному проектуванні системи для таких аномальних ситуацій. Цей інцидент також виявив, що в умовах зростаючої популярності автоматизованих систем контроль якості та масштабу автоматично згенерованого контенту все ще потребує людського нагляду та втручання.

Вплив збою Cloudflare та реагування на надзвичайні ситуації

Вплив цього збою поширився від технологічних гігантів до критично важливої інфраструктури, що показує системну важливість Cloudflare в сучасній екосистемі інтернету. Компанія штучного інтелекту Anthropic PBC підтвердила, що її чат-бот Claude AI зазнав впливу, також виникли перебої на сайті Федеральної комісії з енергетичного регулювання США (FERC), який є ключовою платформою для доступу багатьох компаній, юристів та регуляторних органів до регуляторних справ та документів.

Транспортна система також не змогла уникнути цього. Представник Управління метрополітену Нью-Йорка (MTA) підтвердив, що транспортна система Нью-Йорка постраждала від перебоїв у Cloudflare, і веб-сайт агентства закликає пасажирів використовувати свій додаток MTAapp або TrainTime для отримання актуального стану транспорту та планування поїздок. Департамент транспорту Нью-Джерсі також повідомив, що його веб-сайт і мобільні додатки зазнали впливу, і попередив, що послуги тимчасово недоступні або працюють повільно. Ці ланцюгові реакції в критичній інфраструктурі підкреслюють системний ризик централізованих інтернет-сервісів.

Ключова хронологія подій збою Cloudflare

Початок збоїв: спостережено аномальний пік трафіку о 6:20 ранку за Нью-Йоркським часом

Вплив: X, ChatGPT, Claude AI, FERC, транспортні системи Нью-Йорка та Нью-Джерсі тощо

Тривалість: майже 4 години повного переривання обслуговування

Причина: профіль управління загрозами перевищив очікуваний обсяг, що призвело до збою системи.

Історія: У липні 2019 року програмний збій призвів до 30-хвилинного перерви, у червні 2022 року сталося 19 збоїв дата-центрів тривалістю 1,5 години.

Аналіз історичних подій та моделей

Це не перший випадок великого збою сервісу для Cloudflare. Оглядаючи липень 2019 року, уразливість у програмному забезпеченні Cloudflare призвела до виснаження всіх обчислювальних ресурсів компанії, внаслідок чого тисячі веб-сайтів по всьому світу, включаючи Discord, Shopify, SoundCloud та основні CEX, були недоступні протягом 30 хвилин. У червні 2022 року Cloudflare знову зазнав збою, що вплинуло на трафік 19 його дата-центрів, фактично закривши основні веб-сайти та сервіси, подія тривала близько півтори години.

Порівнюючи ці події з нещодавнім приблизно 15-годинним перервом у Amazon AWS, можна спостерігати тривожну тенденцію: залежність глобального Інтернету від кількох постачальників інфраструктури створює системний ризик. Професор кібербезпеки Суррейського університету Алан Вудвард прокоментував, що простої у вівторок є останнім прикладом залежності Інтернету від “відносно невеликої кількості учасників”, він охарактеризував Cloudflare як “найбільшу компанію, про яку ви ніколи не чули”.

Відповідь підприємства та відновлення довіри

Головний технічний директор Cloudflare Дейн Кнехт вибачився за цей інцидент у пості на X, він заявив: “Ця проблема, її наслідки та час вирішення є неприпустимими. Робота вже ведеться, щоб забезпечити, що це не повториться, але я знаю, що сьогодні це завдало справжнього болю. Довіра клієнтів є нашою найвищою цінністю, і ми зробимо все можливе, щоб відновити цю довіру.”

Такий підхід, що полягає в прямому визнанні помилок і зобов'язанні вдосконалюватися, є надзвичайно важливим для підтримки довіри клієнтів. З точки зору управління технологіями, стандартні процедури після таких подій включають аналіз причин, повторну оцінку планування потужностей, підвищення систем моніторингу та тестування програм відновлення після збоїв. Враховуючи, що програмне забезпечення Cloudflare використовується десятками тисяч компаній по всьому світу як буфер між їхніми веб-сайтами та кінцевими користувачами, а також спрямоване на захист їхніх сайтів від атак трафіку, які можуть призвести до перевантаження, стабільність їхніх систем має прямий вплив на загальне здоров'я Інтернету.

Роздуми про галузь та ініціативи з децентралізації

Ця аварія знову розгорнула дискусію про впровадження децентралізованих фізичних інфраструктурних мереж (DePIN). Деякі представники криптоіндустрії закликають до більш широкого впровадження DePIN для вирішення подібних проблем; ця мережа використовує блокчейн-інценттиви для координації та винагороди людей за побудову та підтримку інфраструктури в реальному світі, створюючи відкритий, спільнотний рівень інфраструктури, уникаючи залежності від централізованих компаній.

Генеральний директор проекту DePIN, зосередженого на розподіленій хмарній інфраструктурі, Нökkvi Dan Ellidason заявив: “Ми маємо перейти до справжньої розподіленої хмарної моделі. Використовуючи наявні глобально розподілені ресурси (такі як недостатньо використовувані ПК), Gaimin будує мережу, що має потужність, розподілену по різних регіонах і континентах, що ускладнює можливість єдиної помилки вразити всю глобальну систему. Це єдиний спосіб захистити цифрову економіку від вразливостей, притаманних централізованим системам.”

Аналіз ризиків централізації інфраструктури

Погляд професора Вудварда безпосередньо вказує на суть проблеми: “Люди не мають вибору, окрім як покладатися на відносно невелику кількість великих компаній.” Ця залежність створює ризик єдиної точки збою, коли ці ключові учасники стикаються з проблемами, вплив від яких може поширюватися по всій галузі. Від Cloudflare до Amazon AWS, CrowdStrike та Microsoft, у останні роки низка інцидентів підкреслила взаємопов'язаність цифрової екосистеми.

Порівняння різних типів збоїв також є дуже повчальним. Минулорічне дефектне програмне оновлення компанії CrowdStrike Holdings Inc. призвело до збою мільйонів пристроїв, що працюють на системі Windows корпорації Microsoft, що порушило роботу кількох галузей, таких як авіаперевезення, банки та охорона здоров'я. Збій CrowdStrike стався через помилку продукту, що працює на найглибшому рівні клієнтських комп'ютерів. На відміну від цього, Cloudflare захищає вебсайти та платформи, тобто це причина, чому під час збоїв Cloudflare багато популярних вебсайтів виявляються недоступними або ненадійними.

Інженери Cloudflare, можливо, не думали, що вразливість інтернету криється не тільки в глибинах коду, але й у надмірно централізованій архітектурі — кожен крах централізованого сервісу голосує за децентралізоване майбутнє. Від метро Нью-Йорка до AI-чат-ботів, сучасне суспільство так сильно залежить від стабільності кількох технологічних компаній, що це відкриття викликає більше роздумів, ніж будь-яка сама несправність.

Часті запитання

Яка основна причина глобального збою Cloudflare?

Виникнення збою програмної системи, яка обробляє частину трафіку служб, спричинено автоматично згенерованим профілем для управління загрозами, який перевищив очікуваний обсяг, коли кількість записів у файлі перевищила обмеження.

Які важливі послуги постраждали від цього збою?

Вплив охоплює технологічні платформи, такі як X, ChatGPT, Claude AI, а також ключову інфраструктуру, таку як Федеральна комісія з регулювання енергетики США, транспортні системи Нью-Йорка та Нью-Джерсі.

Чи має Cloudflare подібну історію простоїв?

У липні 2019 року через програмну уразливість стався глобальний збій сайтів на 30 хвилин, у червні 2022 року через збої в 19 дата-центрах обслуговування було перервано приблизно на 1,5 години, що свідчить про те, що системні ризики продовжують існувати.

Які є плани реагування в галузі на такі події?

Законодавство DePIN (деконцентраційна мережа фізичної інфраструктури) було запропоноване для побудови розподіленої інфраструктури через блокчейн-стимули, що зменшує залежність від централізованих постачальників послуг.

Як офіційно відповів Cloudflare на цей інцидент?

CTO Дейн Кнехт публічно вибачився, визнав, що вплив проблеми та час їх вирішення є неприйнятними, і заявив, що робота вже ведеться, щоб забезпечити недопущення подібних інцидентів у майбутньому.

GMRX-8.26%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити