Как одно обновление базы данных может вывести из строя 20% глобального интернета

11 ноября — предупреждение о сбое: кто платит за инфраструктуру, когда Cloudflare выходит из строя?

В 6:20 утра по восточному времени США примерно 20% глобального интернет-трафика внезапно остановилось. Обычное изменение прав доступа к базе данных вызвало цепную реакцию, которая привела к масштабному сбою ключевых сервисов, поддерживающих современную сеть.

Это не хакерская атака и не внешняя угроза. Источник проблемы — всего лишь конфигурационный файл, который после увеличения объема превысил предельные значения системы.

Катастрофа, начавшаяся с одной строки запроса к базе данных

Хронология событий ясна и жестока:

UTC 11:05 — Cloudflare обновляет права доступа к кластеру базы данных ClickHouse с целью повышения безопасности и надежности.

UTC 11:28 — изменения затрагивают пользовательскую среду, впервые появляется ошибка в логах.

UTC 11:48 — официальный статус-страница признает сбой.

UTC 17:06 — сервис полностью восстановлен, продолжительность более 5 часов.

Техническая правда

Основная причина сбоя — казалось бы, простая ошибка: запрос к базе данных, отвечающий за генерацию конфигурационных файлов системы защиты от ботов Cloudflare, не содержит фильтра по «имени базы данных».

Это привело к возврату дублирующихся записей — одна из предустановленной базы данных, другая — из низкоуровневого хранилища r0. Размер файла конфигурации увеличился вдвое, с примерно 60 до более 200 характеристик.

Cloudflare ранее установила жесткий лимит в 200 характеристик для предзагруженных данных, считая, что «это значительно превышает текущие потребности». Но когда случилась авария, этот казавшийся щедрым запас мгновенно исчерпался.

Объем файла превысил лимит, и код на Rust прямо выбросил ошибку: “thread fl2_worker_thread panicked: called Result::unwrap() on an Err value”

Система защиты от ботов — ядро сетевого уровня Cloudflare. Когда она выходит из строя, системы проверки состояния, которые управляют балансировкой нагрузки и определяют «какие серверы работают нормально», тоже перестают функционировать.

Самое ироничное — этот конфигурационный файл обновляется каждые 5 минут. Если запрос выполняется после обновления кластера, он генерирует ошибочные данные. В результате сеть Cloudflare то «включается», то «выключается» — иногда загружая правильные файлы, иногда — ошибочные.

Такое «чередование сбоев» заставило инженеров думать, что происходит масштабная DDoS-атака. Ведь внутренние ошибки обычно не вызывают циклов восстановления и сброса.

В конце концов, после обновления всех узлов ClickHouse каждый раз создавались неправильные файлы. Отсутствие точных системных сигналов привело к тому, что система защиты по умолчанию перешла в «осторожный режим», считая большинство серверов «нездоровыми». В то время как интернет-трафик продолжал поступать на крайние узлы Cloudflare, он не мог быть правильно маршрутизирован.

Тихое время в глобальной сети

Полностью вышла из строя платформа Web2

  • X платформа получила 9 706 сообщений о сбоях
  • ChatGPT перестал отвечать в диалогах
  • Spotify прервал потоковую передачу
  • Uber и службы доставки вышли из строя
  • Игроки столкнулись с принудительным разрывом соединения
  • Даже автоматические кассы McDonald’s показывали ошибочные интерфейсы

В криптоиндустрии тоже никто не застрахован

Основные биржи столкнулись с сбоями интерфейсов — пользователи не могли войти или совершать сделки.

Блокчейн-обозреватели (например, Etherscan, Arbiscan) полностью вышли из строя.

Платформы аналитики данных (DeFiLlama) начали выдавать периодические ошибки сервера.

Производители аппаратных кошельков выпустили объявления о снижении доступности своих сервисов.

Единственное «исключение» — сама блокчейн-система

По сообщениям, у ведущих бирж не было фронтенд-сбоев, транзакции на цепочке шли нормально. Сам блокчейн оставался полностью работоспособным, признаков разрыва консенсуса не было.

Это выявило острую противоречивость: если блокчейн продолжает создавать блоки, а никто к нему не может получить доступ, значит, криптовалюта всё ещё «онлайн»?

Роль Cloudflare в глобальном интернет-трафике

Cloudflare не хостит сайты и не предоставляет облачные серверы. Его роль — «посредник» — между пользователями и сетью.

Ключевые данные:

  • Обслуживает 24 миллиона сайта
  • Имеет крайние узлы в 120 странах и 330 городах
  • Обрабатывает около 20% глобального интернет-трафика
  • Занимает 82% рынка DDoS-защиты
  • Общая пропускная способность крайних узлов — 449 Тбит/с

Когда такой «посредник» выходит из строя, все зависимые от него сервисы одновременно становятся «недоступными».

Генеральный директор Cloudflare Мэттью Принс в официальном заявлении прямо заявил: «Это самый серьезный сбой Cloudflare с 2019 года… За последние более 6 лет у нас не было таких инцидентов, которые бы сделали недоступными большую часть ключевого интернет-трафика через нашу сеть.»

4 крупных сбоя за 18 месяцев: почему индустрия всё ещё не меняется?

Июль 2024 — уязвимость в обновлении безопасности CrowdStrike вызвала глобальный сбой ИТ-систем (отменены рейсы, задержки в больницах, заморозка финансовых сервисов)

20 октября 2025 — сбой AWS продолжался 15 часов, в регионе Восточного побережья США прервалась работа DynamoDB, что привело к отключению нескольких блокчейн-сетей

29 октября 2025 — проблемы синхронизации настроек Azure, сбой Microsoft 365 и Xbox Live

18 ноября 2025 — сбой Cloudflare, затронувший около 20% интернет-трафика по всему миру

Риски модели единственного подрядчика

AWS контролирует около 30% рынка облачной инфраструктуры, Microsoft Azure — 20%, Google Cloud — 13%. Три компании обеспечивают более 60% инфраструктуры современного интернета.

Индустрия криптовалют должна была быть «децентрализованным» решением, но сегодня она вынуждена полагаться на эти самые централизованные глобальные провайдеры.

При сбоях единственная стратегия — ждать. Ждать, пока Cloudflare исправит, AWS восстановит, Azure применит патчи.

Ложь «децентрализации»: децентрализация на уровне протокола — не равна децентрализации на уровне доступа

Обещания криптоиндустрии были следующими:

Децентрализованные финансы, цензура-устойчивые валюты, системы без доверия, отсутствие единой точки отказа, код — закон

Реальность 18 ноября: сбой утром парализовал большинство криптосервисов на несколько часов.

Технически: ни один протокол блокчейна не сообщил о сбое.

На практике: интерфейсы транзакций вышли из строя, браузеры не работают, платформы данных недоступны, на экране — ошибки 500.

Пользователи не могут получить доступ к «децентрализованным» блокчейнам, которые, по идее, должны быть «под их контролем». Сам протокол работает нормально — если только вы можете «к нему подключиться».

Почему индустрия всё ещё выбирает «удобство», а не «принципы»?

Самостоятельное создание децентрализованной инфраструктуры — это дорого, требует надежного электроснабжения, обслуживания выделенной пропускной способности, найма специалистов по безопасности, реализации георезервов, построения аварийных систем, круглосуточного мониторинга.

Использование Cloudflare — это просто: нажми кнопку, введи данные кредитной карты, за несколько минут всё настроено.

Стартапы стремятся к «быстрому выходу на рынок», инвесторы требуют «эффективности капитала» — все выбирают «удобство», а не «устойчивость к сбоям».

До тех пор, пока «удобство» не станет настолько неудобным, что его невозможно игнорировать.

Почему «альтернативы децентрализации» «хорошо воспринимаются, но не пользуются популярностью»?

Децентрализованное хранение (например, Arweave), распределенная передача файлов (IPFS), децентрализованные вычисления (Akash), децентрализованный хостинг (Filecoin) — такие решения существуют.

Но у них есть проблемы:

  • Производительность уступает централизованным решениям, задержки заметны пользователям
  • Низкая популярность, сложность использования
  • Стоимость зачастую выше аренды инфраструктуры у трех крупнейших облачных провайдеров

Создать по-настоящему децентрализованную инфраструктуру — очень сложно, гораздо сложнее, чем кажется.

Большинство проектов лишь декларируют «децентрализацию», но редко реализуют её на практике. Выбор централизованных решений — проще и дешевле, пока не случится сбой.

Новые вызовы для регуляторов

За 30 дней три крупных сбоя привлекли повышенное внимание регуляторов:

  • Являются ли эти компании «системно важными»?
  • Следует ли регулировать сетевую инфраструктуру как коммунальные услуги?
  • Какие риски возникают, если «слишком большие, чтобы рухнуть», сочетаются с технологической инфраструктурой?
  • Создает ли контроль Cloudflare за 20% интернет-трафика монопольную ситуацию?

Министерство финансов США продвигает идею внедрения удостоверений личности в смарт-контракты, требуя прохождения KYC для каждой DeFi-операции. При следующем сбое инфраструктуры пользователи потеряют не только возможность совершать транзакции, но и способность «подтвердить свою личность» в финансовой системе.

Текущий сбой в 3 часа превратится в «недоступность» на 3 часа — только потому, что система аутентификации работает на инфраструктуре, которая уже вышла из строя.

От «удобства» к «неизбежности»: когда наступит перелом?

18 ноября криптоиндустрия не «потерпела крах» — сама блокчейн-система работает идеально.

Настоящий «крах» — это коллективное самообман:

  • думать, что можно построить «непробиваемое» приложение на «слабой» инфраструктуре
  • считать, что контроль трех компаний над «доступом» делает «цензурную устойчивость» реальной
  • полагать, что одна конфигурация файла Cloudflare решит, сможет ли миллионы торговать, — и «децентрализация» всё ещё имеет смысл

Способность инфраструктуры противостоять сбоям — не «опциональный бонус», а «краеугольный камень» — без нее всё остальное теряет смысл.

Следующий сбой уже назревает — возможно, от AWS, возможно, от Azure, возможно, от Google Cloud, а может, и от повторного сбоя Cloudflare. Может случиться в следующем месяце или уже на следующей неделе.

Выбор централизованных решений по-прежнему дешевле, быстрее и удобнее — пока не станет иначе.

Когда следующий раз конфигурация Cloudflare вызовет скрытую уязвимость в ключевой службе, мы снова увидим знакомую картину: сотни ошибок 500, полное приостановление транзакций, работа блокчейна — а доступа нет, обещания компаний «сделать лучше в следующий раз» — и они так и не сдержат слова.

Это — текущая проблема индустрии: всё не меняется, потому что «удобство» всегда побеждает «риски» — до тех пор, пока цена «удобства» не станет настолько высокой, что её невозможно игнорировать.

AR5,24%
FIL4,14%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить