
תצוגת Cloudflare בטלפון. צילום: אינטרנט.
קלאודפלייר "מתעטש", והאינטרנט "מצטנן".
בערב ה-18 בנובמבר (שעון האנוי), משתמשים בווייטנאם ובאזורים רבים אחרים ברחבי העולם התמודדו עם קשיים בגישה למספר פלטפורמות מרכזיות. תקרית חמורה זו לא נגרמה עקב מתקפת סייבר מתוחכמת, אלא עקב קובץ תצורה שנוצר אוטומטית במערכת.
Cloudflare משמשת כ"שומר סף" מכריע ומתווך בין משתמשים לשרתי אתרים. החברה מספקת שירותים חיוניים רבים, כולל רשת אספקת תוכן (CDN) להאצת זמני טעינת דפים ולהגנת מפני התקפות DDoS, ושירותי DNS לחיבור רשתות לכתובות ה-IP הנכונות. עם ממוצע של 81 מיליון בקשות HTTP לשנייה, כאשר מערכות Cloudflare מתקלקלות, ההשפעה מיידית ונרחבת.
שורה של שירותים מרכזיים הופרעו, כולל X (לשעבר Twitter), ChatGPT, Canva, Grindr, Spotify, OpenAI ו-Claude. משתמשים ראו לעתים קרובות הודעות "500 Internal Server Error" או בקשות לנסות שוב לאחר מספר דקות, מה שהצביע ישירות על שגיאות שרת פנימיות ברשת Cloudflare. Downdetector רשם מעל 11,000 דיווחי משתמשים בשיאו, לפני שירד ל-2,800 כאשר Cloudflare פרסה תיקונים.
הפסקה טכנית בקנה מידה גדול ב-Cloudflare – חברת תשתית המטפלת בכ-20% מתעבורת האינטרנט העולמית – חשפה במהרה את השבריריות הטבועה באינטרנט המודרני. מומחים הגיבו: "כאשר Cloudflare מתעטש, האינטרנט מצטנן".
האשם הוא קובץ תצורה גדול מדי.
התקרית החלה בסביבות השעה 12:00 UTC. Cloudflare אישרה מאוחר יותר כי שורש התקרית היה קובץ תצורה שנוצר אוטומטית שנועד לנהל תעבורה זדונית. קובץ זה חרג מגודלו המיועד וגרם לתקלה במערכת עיבוד התעבורה של מספר שירותי Cloudflare.
רוב לי, מנהל בינה מלאכותית ומחקר במכון SANS, ציין כי בעת הפעלת תשתית בקנה מידה של Cloudflare, אפילו שינוי פאזה קטן יכול להיות בעל השלכות עצומות. "בסביבה בעלת ביצועים גבוהים, עיכוב של אלפית שנייה בלבד יכול להפוך לצוואר בקבוק עבור זרימת התעבורה כולה", אמר לי.
קובץ תצורה זה מציין מדיניות ניתוב, קובע איזון עומסים וכיצד מתפזרת התעבורה הגלובלית. עלייה פתאומית בגודלו עלולה להאט את הניתוח, ליצור שגיאות זיכרון, לגרום להתנגשות CPU או לפגוע בלוגיקה במערכות התלויות בו.
קלאודפלייר הכירה במהירות בבעיה, ותיארה שגיאת 500 נפוצה ברחבי הרשת. החברה אישרה גם כי "אין ראיות לכך שזו הייתה תוצאה של התקפה".
מיליארדי דולרים בהפסדים כספיים.
ההשלכות עבור Cloudflare חרגו מעבר לתסכול המשתמשים. מניית החברה ירדה ב-2.3% במסחר הבוקר בעקבות התקרית, שווה ערך לכמעט 1.8 מיליארד דולר בשווי שוק שנמחק באופן מיידי.
בלב המשבר הפיננסי עמדו הסכמי רמת שירות (SLA). עם כ-90 דקות של השבתה בליבת הפעילות, Cloudflare הייתה מחויבת לפצות את הלקוחות. כשלים טכניים אלה שחקו ישירות את ההכנסות. מחקר בתעשייה הראה שכל שעת השבתה עלולה לעלות לעסק טכנולוגיה בינוני בממוצע 300,000 דולר. אם נכפיל את זה ביותר מ-300,000 לקוחות Cloudflare - כולל ענקיות כמו OpenAI וגוגל - ההשלכות עלולות להגיע לעשרות מיליוני דולרים בתקרית אחת.
יתר על כן, אירוע זה התרחש דווקא כאשר Cloudflare הטמיעה שירותי בינה מלאכותית כמו Workers AI, הדורשים יציבות כמעט מוחלטת. "מעידה" אחת לא רק תגרום לאובדן שכר אלא גם לצמיחה איטית בשוק הבינה המלאכותית, שצפוי להגיע לשווי של 100 מיליארד דולר עד 2028.
לקחים על שבריריות האינטרנט
הפסקת השירות של Cloudflare ממשיכה להוות קריאת השכמה לגבי שבריריות האינטרנט. זוהי תקרית התשתית הגדולה השנייה בתוך חודש אחד בלבד, לאחר השיבוש של Amazon Web Services (AWS) באוקטובר.
מומחים מודאגים מהמודל הריכוזי, שבו האינטרנט המודרני בנוי על כמה "נקודות כשל בודדות". כאשר צווארי בקבוק כמו Cloudflare, AWS או Google Cloud נכשלים, כל המערכת האקולוגית תיעצר.
מרדת' ויטאקר, נשיאת סיגנל, הצהירה פעם כי לשירות "אין ברירה אחרת" אלא לפעול על ספקים גדולים. הבעיה טמונה בתלות. חברות בונות תהליכים עסקיים על ההנחה של זמן פעולה תקין של 99.9%, ואז נדהמות כשהן נתקלות בשיעור כישלון של 0.1%.
תלות זו מחמירה כאשר עסקים משלבים בינה מלאכותית בתהליכי עבודה מרכזיים (תמיכת לקוחות, הפקת תוכן). כאשר עוזרי בינה מלאכותית מתקלקלים, לרוב החברות חסרות תוכניות מגירה, מכיוון שהן האצילו משימות קוגניטיביות למערכות שאינן בשליטתן, על תשתית שאינה בבעלותן.
Cloudflare מחויבת לחקירות ולשדרוגים יסודיים של מערכות קריטיות, אך תקרית זו משמשת כתזכורת יקרה: "תשתית קריטית עם נקודת כשל יחידה היא אסון הממתין לקובץ תצורה תקין."
היין טאו (קומפילציה)
מקור: https://doanhnghiepvn.vn/cong-nghe/cloudflare-va-cu-hat-xi-lam-bay-hoi-hang-ty-usd/20251119051528023
תגובה (0)