Напевно, ви все ще пам’ятаєте, як ледве два дні тому здавалося, що більше половини Інтернету не працює або не реагує, того самого дня, коли ми мали можливість показати, що все пов’язано з збій в одному з центрів обробки даних Amazon, зокрема той, який компанія розташовувала в північній частині Вірджинії. У пам’яті залишається, оскільки через збій такі служби, як Slack, Business Insider, Quora ... були буквально без доступу.
Нарешті, нам не довелося чекати занадто довго, щоб знати висновки, які вони дійшли до Amazon, де, мабуть, вся проблема була буквально пов’язана з тим, що працівник неправильно ввів команду. Це, як не дивно, призвело до того, що всі послуги платформи Amazon Web Services не використовувались годинами.
Співробітник Amazon понесе вину у залишенні без доступу до ЗМІ.
Як опублікувала сама Amazon:
О 9:37 ранку (PST) уповноважений член команди S3 спробував виконати команду, яка мала видалити невелику кількість серверів з однієї з підсистем S3, яка використовується для білінгових систем. На жаль, один з командних елементів був введений неправильно, і велика зграя слуг ненавмисно була вилучена.
Видалені сервери були частиною інших підсистем S3. Однією з них, підсистемою індексації, є та, яка управляє метаданими та розташуванням інформації для всіх об’єктів S3 в регіоні. Друга підсистема, підсистема розташування, обробляє розташування сховища і залежить від підсистеми індексації, щоб добре функціонувати та працювати належним чином.