L’actualité de la transformation

Panne d’AWS : l’enjeu de résister à un risque concentré et aux dépendances imbriquées

AWS est un acteur clé du Cloud qui alimente des millions de sites web et d’applications. Un simple problème technique se transforme vite en perturbation mondiale, comme cela a été le cas lundi 20 octobre.  Or AWS en est à sa quatrième panne en cinq ans dans la région Est des États-Unis. Cette situation illustre les dangers liés à une dépendance excessive à un seul fournisseur de Cloud, alerte Brent Ellis, analyste principal chez Forrester.

Le service DNS n’a pas été conçu pour le Cloud

 « Cette panne particulière d’AWS met en évidence les problèmes fondamentaux liés à la résilience du Cloud, qui découlent d’une dépendance excessive à des services tels que le DNS [service internet de routage des flux à partir des noms de domaines web], qui n’ont pas été conçus pour répondre aux exigences technologiques de l’ère du Cloud » débute-t-il. La panne montre également comment la concentration est un risque lorsque tant d’entreprises de tous les secteurs deviennent dépendantes d’un seul fournisseur de Cloud et, plus précisément, d’une seule région couverte par ce fournisseur, ajoute-t-il.


Dans le cas de la panne d’AWS, le service de base de données DynamoDB interne à Amazon a été impacté par le DNS. « DynamoDB est le premier service identifié comme étant affecté par les problèmes de DNS. Il joue un rôle central dans d’autres services AWS pour l’analyse, l’apprentissage automatique, la recherche, etc. » rappelle l’analyste. « Le problème va au-delà des dépendances régionales internes d’AWS pour toucher les dépendances logiques à travers la plateforme d’AWS » indique-t-il.

S’intéresser aux responsabilités des fournisseurs de Cloud


L’analyste reconnaît qu(il est très tentant de faire appel aux géants de la technologie, mais qu’il serait faux de supposer que ces acteurs sont intrinsèquement résilients, comme le prouvent ces pannes.  Dès lors, il faut également s’intéresser aux responsabilités des fournisseurs de Cloud. « En matière de promesse de résilience, AWS renvoie ses clients à son modèle de responsabilité partagée afin de mettre en évidence les domaines dans lesquels il assume la responsabilité de la disponibilité des services et ceux dont les clients sont responsables » précise Brent Ellis.  

Newsletter La Revue du Digital

Mais dans le cas de la panne de lundi 20 octobre, la situation apparaît particulière. « Lorsque des services essentiels tels que le DNS tombent en panne, même les applications bien conçues peuvent devenir instables. AWS s’efforce de réparer son infrastructure, mais de nombreuses entreprises doivent attendre que cela soit fait, même si elles ont suivi les modèles de conception recommandés » observe-t-il. « Ce problème est devenu récurrent, sans être exclusif à AWS, en particulier dans la région Est des États-Unis, où les clients sont laissés pour compte lorsqu’il s’agit de faire face aux conséquences de la panne » pointe-t-il.

Incapacité des entreprises à gérer les dépendances imbriquées

On se retrouve dès lors face à un risque concentré et aux dangers liés à l’incapacité à gérer les dépendances imbriquées entre les systèmes informatiques. « La commodité l’emporte souvent sur la gestion des dépendances complexes et imbriquées dans des environnements hautement concentrés. Malgré les pannes passées, les organisations qui n’ont pas su gérer cette complexité ont été les premières touchées lorsque des problèmes en cascade ont perturbé les systèmes, les processus et les opérations » décrit-il.

Les entreprises doivent se préparer à ce nouveau type de complexité technologique. On est dans une situation où règne le Cloud, l’écosystème est interdépendant pour les services SaaS, le développement logiciel est externalisé et la visibilité est quasi nulle sur les dépendances. « Cette manière de fonctionner n’est pas un bug, mais bien une caractéristique d’un risque hautement concentré. Même de petites interruptions de service peuvent avoir des répercussions sur l’économie mondiale » résume-t-il.

Accroître la fiabilité des systèmes et examiner les contrats Cloud

Les responsables IT doivent réagir. « Les responsables technologiques des entreprises doivent suivre deux lignes d’action. Ils doivent développer des outils pour accroître la fiabilité des systèmes technologiques et traiter les zones d’ombre contractuelles liées aux modèles de responsabilité partagée avec les fournisseurs de Cloud et de SaaS » conseille-t-il.

Et vous, qu’en pensez-vous ?

Une idée, une réaction, une question ? Laissez-nous un mot ci-dessous.

Je réagis à cet article

Top lectures en ce moment

L’actualité de la transformation

Dossier

L'IA clé de nos besoins vitaux dans l'eau, l'électricité et le gaz

Dossier exclusif

Marchés de l’eau : l’IA générative arrive dans les réponses aux appels d’offres des collectivités

Saur, spécialiste de la distribution d’eau potable,  fait évoluer son processus de réponse aux appels d’offres des collectivités et des industriels en y injectant de l’IA géné…

Stockage de l’électricité : l’IA générative outil d’accélération clé chez Engie

Le stockage de l’électricité est un enjeu stratégique. Engie s’y attelle et mobilise pour cela l’IA générative de type RAG, c'est-à-dire basée sur le traçage des documents source. …

Nouvelle donne dans le gaz naturel : GRDF s’adapte en utilisant l’IA

GRDF, leader de la distribution du gaz naturel en France, affine sa stratégie d’IA. Il s’appuie sur des serveurs internes pour la confidentialité des données de ses clients. GRDF c…


Vous, qu’en pensez-vous ?

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter