
Отображение Cloudflare на экране телефона. Фото: Интернет.
Cloudflare «чихает», и интернет «простудился».
Вечером 18 ноября (по ханойскому времени) пользователи во Вьетнаме и многих других регионах мира столкнулись с трудностями доступа к ряду основных платформ. Этот серьезный инцидент был вызван не сложной кибератакой, а автоматически сгенерированным в системе конфигурационным файлом.
Cloudflare выступает в роли важнейшего «привратника» и посредника между пользователями и серверами веб-сайтов. Компания предоставляет множество важных услуг, включая сеть доставки контента (CDN) для ускорения загрузки страниц и защиты от DDoS-атак, а также DNS-сервисы для подключения сетей к правильным IP-адресам. При среднем объеме HTTP-запросов в 81 миллион в секунду, сбои в работе систем Cloudflare приводят к немедленным и масштабным последствиям.
Работа множества крупных сервисов была нарушена, включая X (ранее Twitter), ChatGPT, Canva, Grindr, Spotify, OpenAI и Claude. Пользователи часто видели сообщения об ошибке «500 Internal Server Error» или просьбы повторить попытку через несколько минут, что напрямую указывало на внутренние ошибки сервера в сети Cloudflare. Downdetector зафиксировал более 11 000 сообщений от пользователей на пике, после чего их количество снизилось до 2800 после того, как Cloudflare выпустила исправления.
Масштабный технический сбой в работе Cloudflare — инфраструктурной компании, обрабатывающей примерно 20% мирового веб-трафика, — быстро выявил присущую современному интернету хрупкость. Эксперты прокомментировали: «Когда Cloudflare чихает, интернет простужается».
Виновником является слишком большой конфигурационный файл.
Инцидент начался примерно в 12:00 UTC. Позже Cloudflare подтвердила, что первопричиной стал автоматически сгенерированный конфигурационный файл, предназначенный для обработки вредоносного трафика. Этот файл превысил допустимый размер и вызвал сбой в системе обработки трафика нескольких сервисов Cloudflare.
Роб Ли, директор по искусственному интеллекту и исследованиям в Институте SANS, отметил, что при работе с инфраструктурой масштаба Cloudflare даже небольшой фазовый сдвиг может иметь огромные последствия. «В высокопроизводительной среде всего лишь миллисекунда задержки может стать узким местом для всего потока трафика», — сказал Ли.
Этот конфигурационный файл определяет политики маршрутизации, балансировку нагрузки и способ распределения глобального трафика. Внезапное увеличение его размера может замедлить анализ, привести к ошибкам памяти, вызвать конкуренцию за ресурсы ЦП или повредить логику в системах, которые от него зависят.
Компания Cloudflare оперативно признала проблему, описав широко распространенную ошибку 500 в сети. Компания также подтвердила, что «нет никаких доказательств того, что это стало результатом атаки».
Финансовые потери исчисляются миллиардами долларов.
Последствия для Cloudflare вышли за рамки простого недовольства пользователей. После инцидента акции компании упали на 2,3% в ходе утренних торгов, что эквивалентно мгновенной потере почти 1,8 миллиарда долларов рыночной капитализации.
В основе финансового кризиса лежали соглашения об уровне обслуживания (SLA). Приблизительно 90 минут простоя системы Cloudflare была обязана компенсировать клиентам убытки. Эти технические сбои напрямую подрывали выручку. Исследование отрасли показало, что каждый час простоя может обходиться среднему технологическому бизнесу в 300 000 долларов. Умножьте это на более чем 300 000 клиентов Cloudflare, включая таких гигантов, как OpenAI и Google, и последствия одного инцидента могут составить десятки миллионов долларов.
Более того, этот инцидент произошел именно тогда, когда Cloudflare активно внедряла сервисы искусственного интеллекта, такие как Workers AI, которые требуют практически абсолютной стабильности. Один-единственный «сбой» мог бы привести не только к потере компенсации, но и замедлить рост рынка ИИ, который, по прогнозам, к 2028 году достигнет 100 миллиардов долларов.
Уроки о хрупкости интернета
Сбой в работе Cloudflare продолжает тревожить нас о хрупкости интернета. Это уже второй крупный инцидент с инфраструктурой всего за месяц, после сбоя в работе Amazon Web Services (AWS) в октябре.
Эксперты обеспокоены централизованной моделью, в которой современный интернет построен на нескольких «единых точках отказа». Когда выходят из строя такие «узкие места», как Cloudflare, AWS или Google Cloud, вся экосистема останавливается.
Мередит Уиттакер, президент Signal, однажды заявил, что у сервиса «не было другого выбора», кроме как работать на крупных провайдерах. Проблема заключается в зависимости. Компании строят бизнес-процессы, исходя из предположения о 99,9% времени безотказной работы, а затем с ужасом обнаруживают, что уровень отказов составляет всего 0,1%.
Эта зависимость усугубляется, когда компании интегрируют ИИ в основные рабочие процессы (поддержка клиентов, создание контента). Когда ИИ-помощники дают сбой, у большинства компаний отсутствуют планы действий в чрезвычайных ситуациях, поскольку они делегируют когнитивные задачи системам, которые они не контролируют, и инфраструктуре, которая им не принадлежит.
Компания Cloudflare стремится к тщательному расследованию и модернизации критически важных систем, но этот инцидент служит дорогостоящим напоминанием: «Критическая инфраструктура с единой точкой отказа — это катастрофа, ожидающая корректного конфигурационного файла».
Хиен Тао (составлено)
Источник: https://doanhnghiepvn.vn/cong-nghe/cloudflare-va-cu-hat-xi-lam-bay-hoi-hang-ty-usd/20251119051528023






Комментарий (0)