Vous vous souviendrez sûrement encore qu'il y a deux jours à peine, il semblait que plus de la moitié d'Internet était en panne ou ne répondait pas, le même jour, nous avons eu l'occasion de révéler que tout était dû à une panne dans l'un des centres de données d'Amazon, plus précisément celui que l'entreprise a situé dans la partie nord de la Virginie. En mémoire il reste car, suite à une panne, des services comme Slack, Business Insider, Quora ... étaient littéralement sans accès.
Enfin, nous n'avons pas eu à attendre trop longtemps pour connaître les conclusions auxquelles ils sont parvenus en Amazonie où, apparemment, tout le problème était littéralement dû au fait que un employé a mal saisi une commande. Cela, assez curieusement, a rendu tous les services de la plate-forme Amazon Web Services inutilisés pendant des heures.
Un employé d'Amazon portera le blâme pour s'être laissé sans accès aux médias.
Tel que publié par Amazon lui-même:
À 9 h 37 (PST), un membre autorisé de l'équipe S3 a tenté d'exécuter une commande consistant à supprimer un petit nombre de serveurs de l'un des sous-systèmes S3 utilisés pour les systèmes de facturation. Malheureusement, l'un des éléments de commandement n'a pas été entré correctement et un grand groupe de serviteurs a été retiré par inadvertance.
Les serveurs qui ont été supprimés faisaient partie d'autres sous-systèmes S3. L'un d'eux, le sous-système d'indexation, est celui qui gère les métadonnées et l'emplacement des informations pour tous les objets S3 de la région. Le deuxième sous-système, le sous-système d'emplacement, gère l'emplacement du stockage et dépend du sous-système d'indexation pour fonctionner correctement et fonctionner correctement.