
Дисплей Cloudflare на телефоні. Фото: Інтернет.
Cloudflare «чхає», і інтернет «застуджується».
Увечері 18 листопада (за ханойським часом) користувачі у В'єтнамі та багатьох інших регіонах світу зіткнулися з труднощами з доступом до низки основних платформ. Цей серйозний інцидент був спричинений не складною кібератакою, а файлом конфігурації, який був автоматично згенерований у системі.
Cloudflare виступає в ролі важливого «гейткепера» та посередника між користувачами та серверами веб-сайту. Компанія надає багато життєво важливих послуг, зокрема мережу доставки контенту (CDN) для пришвидшення завантаження сторінок та захисту від DDoS-атак, а також послуги DNS для підключення мереж до правильних IP-адрес. Зі середнім показником 81 мільйона HTTP-запитів на секунду, коли системи Cloudflare виходять з ладу, наслідки є негайними та широкомасштабними.
Було збої в роботі низки основних сервісів, зокрема X (раніше Twitter), ChatGPT, Canva, Grindr, Spotify, OpenAI та Claude. Користувачі часто бачили повідомлення «500 Internal Server Error» або запити на повторну спробу через кілька хвилин, що безпосередньо вказувало на внутрішні помилки сервера в мережі Cloudflare. Downdetector зафіксував понад 11 000 повідомлень користувачів на піку свого зростання, перш ніж їх кількість знизилася до 2800, оскільки Cloudflare розгорнув патчі.
Масштабний технічний збій у Cloudflare – інфраструктурній компанії, яка обробляє приблизно 20% світового веб-трафіку – швидко викрив ненадійність сучасного інтернету. Експерти зазначили: «Коли Cloudflare чхає, інтернет застуджується».
Винуватцем є занадто великий файл конфігурації.
Інцидент розпочався близько 12:00 UTC. Пізніше Cloudflare підтвердила, що першопричиною був автоматично згенерований файл конфігурації, призначений для керування шкідливим трафіком. Цей файл перевищив передбачуваний розмір і спричинив збій у системі обробки трафіку кількох сервісів Cloudflare.
Роб Лі, директор зі штучного інтелекту та досліджень в Інституті SANS, зазначив, що під час експлуатації інфраструктури масштабу Cloudflare навіть невеликий фазовий зсув може мати величезні наслідки. «У високопродуктивному середовищі навіть мілісекунда затримки може стати вузьким місцем для всього потоку трафіку», – сказав Лі.
Цей файл конфігурації визначає політики маршрутизації, балансування навантаження та розподіл глобального трафіку. Раптове збільшення його розміру може уповільнити аналіз, створити помилки пам'яті, спричинити конфлікти за процесор або пошкодити логіку в системах, які від нього залежать.
Cloudflare швидко визнала проблему, описавши поширену помилку 500 по всій мережі. Компанія також підтвердила, що «немає жодних доказів того, що це було результатом атаки».
Фінансові збитки на мільярди доларів.
Наслідки для Cloudflare вийшли за рамки розчарування користувачів. Акції компанії впали на 2,3% на ранкових торгах після інциденту, що еквівалентно миттєвій втраті майже 1,8 мільярда доларів ринкової капіталізації.
В основі фінансової кризи лежали угоди про рівень обслуговування (SLA). Через приблизно 90 хвилин простою основної мережі Cloudflare була зобов'язана компенсувати збитки клієнтам. Ці технічні збої безпосередньо зменшили дохід. Галузеве дослідження показало, що кожна година простою може коштувати середньому технологічному бізнесу в середньому 300 000 доларів. Помножте це на понад 300 000 клієнтів Cloudflare, включаючи таких гігантів, як OpenAI та Google, і наслідки можуть сягати десятків мільйонів доларів за один інцидент.
Крім того, цей інцидент стався саме тоді, коли Cloudflare нарощував рівень послуг штучного інтелекту, таких як Workers AI, які вимагають майже абсолютної стабільності. Один «спотикання» призвело б не лише до втрати компенсації, але й до уповільнення зростання ринку штучного інтелекту, який, за прогнозами, до 2028 року сягне 100 мільярдів доларів.
Уроки про крихкість Інтернету
Збій у роботі Cloudflare продовжує бути тривожним сигналом щодо нестабільності інтернету. Це вже другий великий інфраструктурний інцидент лише за один місяць після збою в роботі Amazon Web Services (AWS) у жовтні.
Експерти стурбовані централізованою моделлю, де сучасний інтернет побудований на кількох «єдиних точках відмови». Коли такі вузькі місця, як Cloudflare, AWS або Google Cloud, виходять з ладу, вся екосистема зупиниться.
Мередт Віттакер, президент Signal, якось заявив, що сервіс «не мав іншого вибору», окрім як працювати з основними провайдерами. Проблема полягає в залежності. Компанії будують бізнес-процеси, виходячи з припущення про 99,9% безвідмовної роботи, а потім шоковані, коли стикаються з показником збоїв у 0,1%.
Ця залежність посилюється, коли компанії інтегрують ШІ в основні робочі процеси (підтримка клієнтів, виробництво контенту). Коли помічники ШІ дають збій, більшість компаній не мають планів дій на випадок надзвичайних ситуацій, оскільки вони делегували когнітивні завдання системам, які вони не контролюють, на інфраструктурі, якою вони не володіють.
Cloudflare прагне проводити ретельні розслідування та модернізацію критично важливих систем, але цей інцидент слугує дорогим нагадуванням: «Критична інфраструктура з єдиною точкою відмови — це катастрофа, яка очікує на належний файл конфігурації».
Хієн Тхао (компіляція)
Джерело: https://doanhnghiepvn.vn/cong-nghe/cloudflare-va-cu-hat-xi-lam-bay-hoi-hang-ty-usd/20251119051528023






Коментар (0)