
A Cloudflare kijelzője egy telefonon. Fotó: Internet.
A Cloudflare „tüsszent”, az internet pedig „megfázik”.
November 18-án este (hanoi idő szerint) vietnami és a világ számos más régiójában a felhasználók nehézségekbe ütköztek számos nagyobb platform eléréséhez. Ezt a súlyos incidenst nem egy kifinomult kibertámadás, hanem egy, a rendszerben automatikusan generált konfigurációs fájl okozta.
A Cloudflare kulcsfontosságú „kapuőrként” és közvetítőként működik a felhasználók és a weboldalak szerverei között. A vállalat számos létfontosságú szolgáltatást nyújt, beleértve a tartalomszolgáltató hálózatot (CDN) az oldalak betöltési idejének felgyorsítására és a DDoS-támadások elleni védelemre, valamint a DNS-szolgáltatásokat a hálózatok megfelelő IP-címekhez való csatlakoztatásához. Átlagosan 81 millió HTTP-kéréssel másodpercenként, amikor a Cloudflare rendszerei meghibásodnak, a hatás azonnali és széles körű.
Számos jelentős szolgáltatás működése megszakadt, köztük az X (korábban Twitter), a ChatGPT, a Canva, a Grindr, a Spotify, az OpenAI és a Claude. A felhasználók gyakran láttak „500 Internal Server Error” üzeneteket, vagy néhány perc elteltével újrapróbálkozási kéréseket, amelyek közvetlenül a Cloudflare hálózat belső szerverhibáira utaltak. A Downdetector a csúcspontján több mint 11 000 felhasználói jelentést rögzített, mielőtt a Cloudflare javításokat telepített volna, és ez a szám 2800-ra esett vissza.
A Cloudflare – egy a globális webforgalom körülbelül 20%-át kezelő infrastrukturális vállalat – nagyszabású technikai leállása gyorsan leleplezte a modern internet inherens sebezhetőségét. A szakértők így nyilatkoztak: „Amikor a Cloudflare tüsszent, az internet megfázik.”
A bűnös egy túlméretezett konfigurációs fájl.
Az incidens UTC szerint 12:00 óra körül kezdődött. A Cloudflare később megerősítette, hogy a kiváltó ok egy automatikusan generált konfigurációs fájl volt, amelyet a rosszindulatú forgalom kezelésére terveztek. Ez a fájl meghaladta a tervezett méretet, és hibát okozott több Cloudflare szolgáltatás forgalomfeldolgozó rendszerében.
Rob Lee, a SANS Intézet mesterséges intelligencia és kutatás igazgatója megjegyezte, hogy a Cloudflare méretéhez hasonló infrastruktúra üzemeltetésekor már egy kis fáziseltolódás is óriási következményekkel járhat. „Egy nagy teljesítményű környezetben egyetlen milliszekundumos késleltetés is szűk keresztmetszetet jelenthet a teljes forgalom számára” – mondta Lee.
Ez a konfigurációs fájl határozza meg az útválasztási szabályzatokat, a terheléselosztást és a globális forgalom elosztásának módját. Méretének hirtelen növekedése lelassíthatja az elemzést, memóriahibákat okozhat, CPU-versengést okozhat, vagy a logika sérüléséhez vezethet az attól függő rendszerekben.
A Cloudflare gyorsan elismerte a problémát, és egy széles körben elterjedt 500-as hibáról számolt be a hálózaton. A cég azt is megerősítette, hogy „nincs bizonyíték arra, hogy ez támadás eredménye lett volna”.
Több milliárd dolláros anyagi veszteség.
A Cloudflare következményei túlmutattak a felhasználók frusztrációján. A vállalat részvényei 2,3%-ot estek a reggeli kereskedésben az incidens után, ami közel 1,8 milliárd dolláros piaci kapitalizáció azonnali elvesztését jelentette.
A pénzügyi válság középpontjában a szolgáltatási szintű megállapodások (SLA-k) álltak. A körülbelül 90 perces alapvető leállás miatt a Cloudflare köteles volt kártalanítani az ügyfeleket. Ezek a technikai hibák közvetlenül csökkentették a bevételeket. Egy iparági tanulmány kimutatta, hogy a leállás minden órája átlagosan 300 000 dollárba kerülhet egy közepes méretű technológiai vállalkozásnak. Szorozzuk meg ezt a Cloudflare több mint 300 000 ügyfelével – köztük olyan óriásokkal, mint az OpenAI és a Google –, a következmények egyetlen incidens esetén több tízmillió dollárt is jelenthetnek.
Továbbá ez az incidens pontosan akkor történt, amikor a Cloudflare olyan mesterséges intelligencia szolgáltatásokat indított el, mint a Workers AI, amelyek közel abszolút stabilitást igényelnek. Egyetlen „botlás” nemcsak a jövedelemkiesést eredményezné, hanem a mesterséges intelligencia piacának lassú növekedését is, amely a becslések szerint 2028-ra 100 milliárd dolláros lesz.
Tanulságok az internet törékenységéről
A Cloudflare szolgáltatáskiesése továbbra is figyelmeztető jel az internet sérülékenységére. Ez már a második jelentős infrastrukturális incidens mindössze egy hónapon belül, az Amazon Web Services (AWS) októberi leállását követően.
A szakértőket aggasztja a centralizált modell, ahol a modern internet néhány „egyetlen meghibásodási pontra” épül. Amikor a szűk keresztmetszetek, mint például a Cloudflare, az AWS vagy a Google Cloud, meghibásodnak, a teljes ökoszisztéma leáll.
Meredth Whittaker, a Signal elnöke egyszer kijelentette, hogy a szolgáltatásnak „nincs más választása”, mint a nagyobb szolgáltatóktól működnie. A probléma a függőségben rejlik. A vállalatok 99,9%-os üzemidő feltételezésére építik az üzleti folyamataikat, majd megdöbbennek, amikor ezzel a 0,1%-os meghibásodási aránnyal találkoznak.
Ez a függőség súlyosbodik, amikor a vállalkozások integrálják a mesterséges intelligenciát az alapvető munkafolyamatokba (ügyfélszolgálat, tartalomgyártás). Amikor a mesterséges intelligencia asszisztensek meghibásodnak, a legtöbb vállalatnak nincsenek vészhelyzeti tervei, mivel kognitív feladatokat delegáltak olyan rendszerekre, amelyeket nem ők irányítanak, olyan infrastruktúrán, amely nem az övék.
A Cloudflare elkötelezett a kritikus rendszerek alapos vizsgálata és frissítése mellett, de ez az incidens költséges emlékeztetőül szolgál: „Az egyetlen meghibásodási ponttal rendelkező kritikus infrastruktúra katasztrófa, amely megfelelő konfigurációs fájlra vár.”
Hien Thao (Összeállított)
Forrás: https://doanhnghiepvn.vn/cong-nghe/cloudflare-va-cu-hat-xi-lam-bay-hoi-hang-ty-usd/20251119051528023






Hozzászólás (0)