1. כותרת: הפסקת החשמל המתרחשת כעת
על 18 בנובמבר 2025, Cloudflare חווה הפסקת שירות ברמת המערכת משפיע על שירותים ברחבי העולם.
מספר רב של אתרי אינטרנט, ממשקי API ויישומים המסתמכים על Cloudflare — משירותים פיננסיים ועד מדיה חברתית, מפלטפורמות מפתחים ועד כלים ארגוניים פנימיים — נתקלים בהפרעות גישה, כשלים ברזולוציה, פקיעת זמן המתנה לבקשות ובעיות אחרות בתוך פרק זמן קצר.
נתוני הניטור מראים:
- התגובתיות של צומת הקצה של CDN העולמי ירדה ביותר מ- 70%;
- שיעור הכישלונות בשאילתות DNS עלה באופן זמני 45%;
- אזורים מסוימים (כולל צפון אמריקה, אירופה ומזרח אסיה) חוו "הפרעות גישה כמעט עולמיות".
צוותי Cloudflare הרשמיים פועלים לשיקום, אך אירוע זה הפך למשבר תשתיתי נוסף עבור האינטרנט העולמי בשנת 2025.
זה לא רק חושף את הסיכון שבריכוזיות של פלטפורמת אבטחה והאצה בענן אחד, אלא גם מזכיר לנו שוב ש:
בעולם מקושר יותר ויותר, כשל של כל צומת מרכזי עלול להפוך למוקד של זעזוע עולמי באינטרנט..

2. אירועים מרכזיים בשנת 2025: סדרה של זעזועים בתשתיות
שנת 2025 אינה שנה בודדת של כישלונות, אלא תקופה מרוכזת של סיכונים לארכיטקטורת האינטרנט.
בין מרץ לנובמבר, Cloudflare חוותה שלוש תקלות משמעותיות.
(1) מרץ 2025: הפסקת שירות אחסון אובייקטים R2
- משך: שעה ו-7 דקות
- היקף: גלובלי 100% כשלים בכתיבה, 35% קריאה כושלת
- תוצאה ישירה: פלטפורמות מפתחים מרובות ומסדי נתונים בענן חוו הפרעות בכתיבת נתונים
- סיבה טכנית: נעילת אינדקס אחסון + כשל במנגנון השחזור האוטומטי
תובנה מרכזית: שגיאות תצורה בשכבה הלוגיות הן לעתים קרובות הרסניות יותר מתקלות חומרה — הן קשות יותר לאיתור ולתיקון.
(2) יוני 2025: תקלה ב-GCP גורמת להפסקת חשמל עולמית
- הגורם הבסיסי: כשל עולמי בשירות IAM (ניהול זהויות וגישה) של Google Cloud Platform (GCP)
- שרשרת מדורגת:
- כשל ב-GCP IAM → כשלים באימות/באימות שירות Cloudflare
- הפסקת שירות של Cloudflare → שיבוש של כ-20% מתעבורת האינטרנט העולמית
- השירותים שנפגעו כללו: Cursor, Claude, Spotify, Discord, Snapchat, Supabase ועוד.
- משך: כשעתיים
אופי גלובלי: אירוע זה מדגים את הסיכונים הטמונים ב"שרשראות תלות בפלטפורמות ענן" — תקלה בודדת ב-IAM התפתחה תוך שעות ספורות לזעזוע ברשת העולמית.
(3) נובמבר 2025: הפסקת החשמל המתמשכת
- ביטויים:
- חריגות בתגובות צומת קצה, כשלים בשאילתות DNS, כשלים במדיניות WAF;
- הפרעות בחיבור TLS, עם הפסקת תנועת HTTPS באזורים מסוימים;
- שירותי API, אחסון אובייקטים וסנכרון מטמון מושפעים באופן נרחב.
- ניתוח ראשוני:
- חריגות בתצורת מישור הבקרה הגורמות ללולאות ניתוב;
- מנגנוני החזרה אוטומטיים לא הופעלו בזמן;
- מערכת תזמון העומסים הגלובלית נכנסה ל"קיפאון סנכרון".
מגמה: עומק והיקף הכשל הזה עולים בהרבה על תקלות מקומיות קודמות — זהו "אירוע תשתית מלא" טיפוסי.
3. סקירה היסטורית: התפתחות אירועי Cloudflare (2019–2025)
| זמן | הגורם העיקרי | משך | היקף | מאפיינים |
|---|---|---|---|---|
| יולי 2019 | תצורה שגויה של כלל WAF | 30 דקות | גלובלי | דחיפה אוטומטית שגויה |
| אוקטובר 2020 | אנומליה בניתוב BGP | כמה שעות | אירופה, אסיה | חטיפת מסלול חיצוני |
| יוני 2022 | כישלון בעדכון טופולוגיית רשת מרכז הנתונים | שעה אחת | 19 צמתים מרכזיים | התמוטטות מקומית |
| מרץ 2025 | נעילת אחסון אובייקטים R2 | שעה ו-7 דקות | גלובלי | כשלים מלאים בכתיבה |
| יוני 2025 | כשל מדורג ב-GCP IAM | ~2 שעות | גלובלי | תלות מוגברת בין עננים |
| נובמבר 2025 | כשל בסנכרון התצורה הגלובלית | מתמשך | גלובלי | קריסה מערכתית רב-שכבתית |
תובנות לגבי מגמות: משנת 2019 ועד היום, פרופיל הסיכון של Cloudflare התפתח באופן ברור מ"שגיאות בנקודה אחת" ל"קריסת שרשרת תלות מערכתית".
4. ניתוח השפעה: אפקט הדומינו של "התשתית הבלתי נראית" של האינטרנט
(1) ברמת הארגון
- שירותי SaaS, תשלומים ושער API הופרעו באופן גורף;
- תקשורת מיקרו-שירותים בארכיטקטורות מקוריות בענן הופרעה;
- המשכיות עסקית נפגעה קשות.
(2) רמת המשתמש הסופי
- אתרי אינטרנט ואפליקציות לא נטענים;
- שגיאות ברזולוציית DNS גורמות למצבים של "מוות לכאורה";
- סיכוני פרטיות ואבטחה של המשתמשים גדלים (עקב מעבר זמני לשרתים לא אמינים).
(3) ברמת התעשייה
- מגזר פיננסי: עיכובים בתשלומים ושיעורי כשל גבוהים יותר בהזמנות;
- שירותי תוכן: אי-תקינות מטמון CDN והפרעה בהפעלת וידאו;
- ממשל וחינוך: פורטלים ציבוריים הופכים לבלתי נגישים, מה שמפריע להעברת מידע.
מהות: שיבוש בשירות ליבה יחיד עלול לגרום ל"אפקט דומינו" בשרשרת האספקה הדיגיטלית העולמית.
5. גורמים שורשיים: ריכוז, מורכבות והסיכון המצטבר של אוטומציה
| סוג הסיכון | ביטוי אופייני | דוגמה | הבעיה המרכזית |
|---|---|---|---|
| סיכון אוטומציה | תצורות שגויות מתפשטות במהירות | 2019, 2022, מרץ 2025 | היעדר אימות רב-שכבתי |
| סיכון במישור הבקרה | IAM / כשלים בסנכרון התצורה | יוני 2025, נובמבר 2025 | חוסר יכולת לבודד תקלות באופן מקומי |
| ריכוזיות אדריכלית | פלטפורמה אחת הנושאת שכבות שירות רבות | כל האירועים | כשלים בנקודה אחת מועצמים |
| עיכוב בניטור ובחזרה לאחור | איתור מאוחר, התאוששות איטית | אירועים מרובים | חוסר יכולת לתיקון עצמי אוטומטי |
6. המלצות להגנה מערכתית
(1) יתירות רב-שכבתית וארכיטקטורה מבוזרת
| שכבה | אסטרטגיה | הערות יישום |
|---|---|---|
| שכבת DNS | מקביל רב-ספקים (Cloudflare + Route 53 + NS1) | בדיקות בריאות אוטומטיות ומעבר משוקלל |
| שכבת CDN | צירוף Multi-CDN (Cloudflare + Fastly + Akamai) | ניתוב תעבורה דינמי Anycast |
| שכבת אבטחה | בקרה כפולה של WAF בענן ובאתר | מנע חשיפה מלאה כאשר הצד הענן נכשל |
| שכבת נתונים | יתירות רב-אזורית ורב-עננית | גיבויים אוטומטיים ושחזור בין אזורים |
(2) הערכת אבטחה ויציבות אוטומטית (מודל Penligent)
כלים כמו Penligent ניתן להשתמש בו כדי:
- הדמיית עומסים כבדים וכשלים בצמתים;
- זיהוי אוטומטי של תלות בתצורה ולולאות;
- זהו סיכוני צימוד עם שירותי ענן חיצוניים;
- יצירת "ציוני עמידות תשתית" בזמן אמת.
מטרה: זיהוי שינויים מוקדם יותר — הפעלת "הגנה חזויית" ו"ארכיטקטורות מאמתות עצמית".
(3) הנדסת כאוס וניתנות לצפייה
- הזריקו באופן קבוע תקלות מבוקרות כדי לאמת תהליכי תיקון עצמי;
- בנה מדדי נראות בזמן אמת (חביון, אובדן מנות, שיעורי מפסקי זרם);
- הקימו "לוח מחוונים לחוסן" כדי לשלב את תקינות התשתית במדדי הביצוע המרכזיים של הארגון.
7. מסקנות אסטרטגיות: מ"מניעת תקלות" ל"מניעת קריסה מערכתית"
- ממשל מבוזר: הפחתת הריכוזיות של שירותי אינטרנט קריטיים.
- מסגרת ניתוב מהימנה: האצת פריסת RPKI ו-DNSSEC.
- אימות מבוסס בינה מלאכותית: השתמש בלמידת מכונה כדי לזהות דפוסים מסוכנים בתצורה.
- קואליציות להתאוששות מאסונות: בנה מאגרי משאבים לטיפול באסונות חוצה עננים וחוצה תעשיות.
8. מסקנה: חוסן הוא היתרון התחרותי הבסיסי של האינטרנט
רצף האירועים ב-Cloudflare בשנת 2025 מראה כי הפגיעות של האינטרנט אינה עוד בעיה של חברה בודדת, אלא סיכון מבני לכל המערכת האקולוגית הדיגיטלית.
התחרות העתידית לא תוגדר רק על ידי מהירות, אלא על ידי היכולת להתאושש מכישלונות.
רק באמצעות ביזור, יתירות מרובה, אימות אוטומטי ומוכנות מתמשכת לאסונות, האינטרנט יכול להשיג "תשתית המתקנת את עצמה" אמיתית. ההפרעות המתמשכות ב-Cloudflare הן יותר ממשבר טכני — הן אזהרה מערכתית לגבי ארכיטקטורות אינטרנט מרכזיות. עלינו לבנות מחדש את האמון, לשקם את החוסן ולחשוב מחדש על התשתית הבסיסית של האינטרנט.
נספח: ציר זמן של תקלות משמעותיות ב-Cloudflare (2019–2025)
| זמן | סוג | סיבה | משך | היקף |
|---|---|---|---|---|
| 2019.07 | הפסקת שירות עולמית | שגיאה בכלל WAF | 30 דקות | גלובלי |
| 2020.10 | אנומליה ב-BGP | שגיאת ניתוב | כמה שעות | אירופה, אסיה |
| 2022.06 | שגיאה בעדכון טופולוגיית הרשת | כשל בתצורה | שעה אחת | 19 ערים |
| 2025.03 | נעילת אחסון אובייקטים R2 | שגיאת אינדקס | שעה ו-7 דקות | גלובלי |
| 2025.06 | כשל שרשרת GCP | אנומליה IAM | שעתיים | גלובלי |
| 2025.11 | קריסת סנכרון התצורה הגלובלית | כשל במישור הבקרה | מתמשך | גלובלי |
