מה שהחל כתקלה "מקומית" באתר של אמזון ווב סרוויסס (AWS) בווירג'יניה הפך לשיבוש עולמי ששיתק אתרי ממשלה, חברות תעופה, פלטפורמות תקשורת ושירותים אישיים. בבריטניה קרסו אתרי הממשלה, בארצות הברית לא ניתן היה להזמין מונית בליפט או לצפות בתכנים של דיסני+, ובחוף המזרחי התעוררו מיליונים למציאות שבה חלקים מהאינטרנט פשוט לא עבדו.
יונייטד ודלתא לא הצליחו להפעיל את שירותי הצ'ק-אין, ניוזלטרים של הניו יורק טיימס לא נשלחו, ורשתות כמו רדיט וסנאפצ'ט הושבתו לחלוטין. מאחורי כל אלה עומד שרת אחד 0 או ליתר דיוק, מערכת ענקית אחת - שעליה נשענות אינספור פעולות יומיומיות. לפי חברת DeepField Networks, שליש מהאוכלוסייה המקוונת בעולם עושה שימוש יומיומי ב־AWS, בין אם דרך אפליקציות כמו Venmo, מצלמות האבטחה של Ring או שירותי אחסון ומדיה.
המומחה לסייבר ג'יימס נייט, מחברת Digital Warfare, אמר כי עצם האפשרות שתקלה בודדת תשבית רשת כה רחבה היא "מפתיעה מאוד". לדבריו, "בדרך כלל קיימים גיבויים וריבוי מערכות שעובדות במקביל, כך שמערכת אחת שנופלת לא אמורה להשבית את הרשת כולה. זה ממש לא אמור לקרות".
התקלה של אמזון הוכיחה עד כמה אנחנו פגיעים
התקלה, שהחלה מעט אחרי השעה שלוש לפנות בוקר לפי שעון החוף המזרחי, עלתה לאמזון מאות מיליוני דולרים. החברה הצליחה לזהות את הבעיה כבר לאחר כשעתיים, אך לקח לה יותר משמונה שעות לשקם את השירותים ולבודד את מקור התקלה: תת-מערכת פנימית שאחראית על ניטור מאזן העומסים. אמזון נאלצה להאט חלק מהשירותים בכוונה "כדי לאפשר התאוששות מבוקרת".
אפשרות של מתקפת סייבר נשללה כמעט מיד. "אם זו הייתה פריצה, היינו רואים סימנים ברורים - תוכנה זדונית, גישה לא מורשית או תעבורה חריגה ביומנים", הסביר נייט. "אין שום עדות לכך. בנוסף, אמזון מחויבת בחוק לדווח על כל מתקפת סייבר, וזה לא המצב כאן".
האירוע אמנם נפתר, אך הוא הדגיש שוב את התלות ההולכת וגוברת של העולם בכמה חברות בודדות שמחזיקות בשרתי הענן הגדולים: אמזון, גוגל ומיקרוסופט. כל אחת מהן מפעילה מערך עצום של מרכזי נתונים ברחבי העולם, אבל גם ריבוי האזורים לא מונע פגיעוּת. "AWS כבר מחולקת למספר אזורים - בחוף המזרחי, המערבי, באירופה ובאסיה, וזה בדיוק הרעיון של הענן", הסביר נייט, "אבל כשמשהו משתבש, ההשפעה מיידית וחוצת גבולות".
התקלה הנוכחית מצטרפת לשורת קריסות עולמיות שאירעו בשנה האחרונה. ביולי 2024 קרסה חברת הסייבר CrowdStrike וגרמה להשבתה רחבה שנחשבת לגדולה בהיסטוריה: התקלה נמשכה תשעים דקות בלבד, אך הנזק לחברות Fortune 500 הוערך ביותר מחמישה מיליארד דולר. רשת AT&T חוותה כמה תקלות משמעותיות, כולל קריסה של 11 שעות בפברואר האחרון.
לדברי נייט, אלו לא מקרים חריגים אלא סימנים לעידן חדש של פגיעוּת דיגיטלית. "החיים שלנו מתנהלים אונליין, ותקלות כאלה פשוט יקרו", אמר. "אמזון, גוגל ומיקרוסופט הן הסטנדרט הגבוה ביותר בתחום הענן, אבל גם הן לא חסינות. מחר זה יכול לקרות לכל אחת מהן".
כאשר נשאל אם חברות צריכות לפזר את השירותים בין כמה ספקיות ענן כדי להפחית את הסיכון, נייט השיב שזה כמעט בלתי אפשרי מבחינה מעשית. "בתיאוריה זה נשמע נכון, אבל בפועל זה מורכב ולא בהכרח מועיל", אמר. "רוב הנתונים כבר מאוחסנים באזורים שונים של הענן, והרעיון עצמו הוא לפזר את הסיכון – אך הוא לעולם לא נעלם לגמרי".
באמזון הדגישו לאחר מכן כי "העבודה על שיקום השירותים נמשכת וכי התהליכים לשיפור ולמידה כבר בעיצומם”. נייט סיכם שהחברה תנתח לעומק את האירוע ותפיק לקחים: "הם ילמדו מה שקרה, ישפרו את הנהלים ויצאו מזה חזקים יותר", אמר. "אבל המציאות היא שזה יקרה שוב. השאלה היחידה היא מתי - ולא אם".