Jūs noteikti atceraties, kā tikai pirms divām dienām šķita, ka vairāk nekā puse interneta ir nedarbojusies vai nereaģēja, tajā pašā dienā mums bija iespēja atklāt, ka viss ir saistīts ar kļūme vienā no Amazon datu centriem, īpaši tas, kuru uzņēmums atradis Virdžīnijas ziemeļu daļā. Atmiņā paliek tas, ka neveiksmes dēļ tādi pakalpojumi kā Slack, Business Insider, Quora ... bija tiešā nozīmē bez piekļuves.
Visbeidzot, mums nav bijis jāgaida pārāk ilgi, lai uzzinātu secinājumus, ko viņi ir sasnieguši Amazon, kur acīmredzot visa problēma bija burtiski saistīta ar faktu, ka darbinieks nepareizi ievadīja komandu. Dīvainā kārtā tas izraisīja visu Amazon Web Services platformas pakalpojumu izmantošanu stundām ilgi.
Amazon darbinieks uzņemsies vainu par aiziešanu bez piekļuves plašsaziņas līdzekļiem.
Kā publicēja pati Amazon:
9:37 (PST) S3 komandas pilnvarots dalībnieks mēģināja izpildīt komandu, kuras mērķis bija noņemt nelielu skaitu serveru no vienas no S3 apakšsistēmām, kas tiek izmantota norēķinu sistēmām. Diemžēl viens no komandas elementiem tika ievadīts nepareizi, un netīšām tika noņemta liela daļa kalpu.
Noņemtie serveri bija daļa no citām S3 apakšsistēmām. Viena no tām, indeksēšanas apakšsistēma, ir tā, kas apstrādā metadatus un informācijas atrašanās vietu visiem S3 objektiem reģionā. Otra apakšsistēma, atrašanās vietas apakšsistēma, apstrādā krātuves atrašanās vietu un ir atkarīga no indeksēšanas apakšsistēmas, lai tā labi darbotos un darbotos pareizi.