Comment une faute frappe-t-elle temporairement Internet?

Selon l'endroit où vous habitez et les sites Web que vous visitez, vous avez peut-être remarqué qu'Internet agissait mardi. Et maintenant nous savons comment c'est arrivé ...

Selon l'endroit où vous habitez et les sites Web que vous visitez, vous avez peut-être remarqué qu'Internet agissait mardi.  Et maintenant nous savons comment c'est arrivé ...
Publicité

Selon où vous vivez et quels sites Web vous visitez Les meilleurs sites Web sur Internet Les meilleurs sites Web sur Internet Une liste énorme des meilleurs sites Web sur Internet, dans quatorze catégories à portée de main. Ceux-ci sont considérés comme les sites haut de gamme qui vous permettront d'obtenir ce dont vous avez besoin. En savoir plus vous avez peut-être remarqué que l'Internet agissait mardi (28 février 2017). D'innombrables sites Web ont été perturbés et des millions de personnes ont été touchées. Et maintenant, grâce à Amazon admettant la vérité, nous savons comment cela s'est passé ...

Selon le résumé impitoyablement intitulé «Résumé de la perturbation du service Amazon S3 dans la région de Virginie du Nord (États-Unis-Est-1)», une seule faute de frappe était responsable de la panne d'Internet. Et non, ce n'est pas une faute de frappe. Une petite erreur d'un ingénieur malheureux a tué Internet pendant plusieurs heures.

Avez-vous essayé de l'éteindre et rallumer?

Comme l'explique Amazon, à 9h37, un ingénieur Amazon "a exécuté une commande destinée à supprimer un petit nombre de serveurs pour l'un des sous-systèmes S3 utilisé par le processus de facturation S3". Jusqu'ici, tout va bien, car ce membre de l'équipe faisait exactement ce pour quoi ils étaient payés.

"Malheureusement, l'une des entrées de la commande a été entrée incorrectement et un plus grand nombre de serveurs a été supprimé que prévu". Ces serveurs "prenaient en charge deux autres sous-systèmes S3" dont l'un "gère les métadonnées et les informations d'emplacement de tous les objets S3 de la région". Ce qui a créé un problème sérieux.

Amazon a ensuite essayé de l'éteindre et de le rallumer. Malheureusement, "S3 a connu une croissance massive au cours des dernières années et le processus de redémarrage de ces services et d'exécution des vérifications de sécurité nécessaires pour valider l'intégrité des métadonnées a pris plus de temps que prévu". Il a donc fallu attendre 13h54 pour que tout recommence à fonctionner normalement.

Afin d'éviter une répétition des performances, Amazon "apporte plusieurs modifications à la suite de cet événement opérationnel". Cela inclut l'introduction de «sauvegardes pour empêcher la suppression de la capacité», «vérification de nos autres outils opérationnels pour garantir des contrôles de sécurité similaires» et «modifications pour améliorer le temps de récupération des principaux sous-systèmes S3».

Nous vous avons dit que les typos sont toujours importants

J'ai toujours pensé que les fautes de frappe importaient toujours, même en ligne et dans les messages texte Pourquoi les typos sont toujours importants, même en ligne et dans les messages texte [Opinion] Pourquoi les typos sont-ils toujours importants, même en ligne? . C'est naturel, une partie de la vie, une courbe d'apprentissage que nous utilisons pour nous améliorer. Les Typos ne font pas exception. Ils se produisent souvent, et si l'écriture forme un ... Lire la suite. Cet incident malheureux le prouve bien, car il démontre l'impact dévastateur qu'une faute de frappe solitaire peut avoir. OK, donc nous ne sommes pas tous les ingénieurs d'Amazon chargés de maintenir l'Internet opérationnel, mais encore, il n'y a aucune excuse!

Avez-vous été affecté par la panne d'Amazon mardi? Quels sites Web avez-vous remarqué agissant de travers? Comment vous sentez-vous sur le fait qu'une seule faute de frappe a détruit Internet? Que devrait faire Amazon pour éviter une répétition des performances? Veuillez nous en informer dans les commentaires ci-dessous!

Crédit d'image: Marco Verch via Flickr

In this article