Наверняка вы все еще помните, как всего два дня назад казалось, что больше половины Интернета не работает или не отвечает, в тот же день у нас была возможность показать, что все было из-за сбой в одном из центров обработки данных Amazon, в частности тот, который компания разместила в северной части Вирджинии. В памяти он остался, поскольку из-за сбоя такие сервисы, как Slack, Business Insider, Quora ... оказались буквально без доступа.
Наконец, нам не пришлось долго ждать, чтобы узнать, к каким выводам они пришли на Amazon, где, по-видимому, вся проблема была связана буквально с тем, что сотрудник неправильно ввел команду. Это, как ни странно, привело к тому, что все сервисы платформы Amazon Web Services не использовались в течение нескольких часов.
Сотрудник Amazon будет нести вину за то, что ушел без доступа к медиа-сети.
Как опубликовано самой Amazon:
В 9:37 (тихоокеанское стандартное время) уполномоченный член команды S3 попытался выполнить команду, которая должна была удалить небольшое количество серверов из одной из подсистем S3, которая используется для биллинговых систем. К сожалению, один из элементов команды был введен неправильно, и большая группа слуг была случайно удалена.
Удаленные серверы входили в состав других подсистем S3. Одна из них, подсистема индексации, - это та, которая обрабатывает метаданные и расположение информации для всех объектов S3 в регионе. Вторая подсистема, подсистема определения местоположения, обрабатывает местоположение хранилища и зависит от подсистемы индексации, чтобы она работала правильно и правильно.