Unternehmen aller Größen und Branchen verlassen sich heutzutage sehr weitgehend auf Cloud-Dienste. Mit der zunehmenden Nutzung kommt aber eine weniger schöne Seite ans Tageslicht: Es entsteht eine kritische Abhängigkeit von Cloud-Anwendungen und -Diensten, die sich verheerend auf die Geschäftsfähigkeit eines Unternehmens auswirken kann, wenn die Cloud dann doch einmal nicht mehr verfügbar ist.

Da immer mehr Unternehmen auf Cloud Computing setzen, sollten Sie sich jetzt über die wichtigsten Ausfälle bei den großen Providern informieren. Auf Basis dieser Kenntnisse lassen sich Strategien entwickeln, die Ihnen helfen, Unterbrechungen zu vermeiden, wenn es zu einem Ausfall bei einem Ihrer Cloud-Anbieter kommt.

Ausfälle bei Microsoft: Azure erlebte im Oktober 2021 eine ebenfalls etwa sechs Stunden dauernde Störung, die viele Virtual Machine Workloads und einige andere Dienste beeinträchtigte. Als Ursache wird ein Fehler bei VM-Abfragen vermutet, der in den vergangenen Jahren schon mehrfach zu Problemen bei Microsoft 365 geführt haben soll. Zum Beispiel gab es einen Ausfall bei Exchange Online im April 2021, der zu Problemen bei der Zustellung von E-Mails und einem nahezu kompletten Ausfall aller Microsoft-365-Dienste führte. Auch im November 2020 waren Dienste wie Exchange, SharePoint, Microsoft Teams und OneDrive betroffen.

Facebook, Instagram, der Facebook Messenger sowie WhatsApp funktionierten zum Verdruss vieler Nutzer für ungefähr sechs Stunden im Oktober 2021 plötzlich nicht mehr. Laut Facebook waren Änderungen bei der Konfiguration von Routern verantwortlich für den Vorfall. Nach Ansicht von Beobachtern führten größere Änderungen an der Konfiguration des Border Gateway Protocols zu einer Serie von Fehlern.

Ausfälle bei AWS: Drei Störungen bei AWS (Amazon Web Services) im November und Dezember 2021 führten zu wiederholten Erreichbarkeitsproblemen bei vielen bekannten Webseiten und Diensten. Beispiele sind Slack und Epic Games. Einer der Ausfälle dauerte sogar mehr als fünf Stunden. Nach Angaben von AWS traten in automatisierten Systemen „unerwartete Probleme“ auf, die dann zu den nicht erreichbaren Diensten führten.

Warum sind Ausfälle bei Cloud-Providern von so großer Bedeutung?

Alle die genannten Cloud-Ausfälle führen zu einer nahe liegenden Frage: Sind wir mittlerweile viel zu abhängig von der Infrastruktur der Cloud-Provider? Wenn das so ist, müssen wir dann nicht die Cloud-Anbieter als kritische Infrastruktur einstufen?

Die meisten Behörden haben bisher noch keine Anzeichen dafür gezeigt, dass es in nächster Zeit zu einem Wechsel der Einstufung kommen könnte. Das Thema wird aber bereits in anderen Bereichen heiß diskutiert, da immer mehr Unternehmen ihre intern gehosteten Anwendungen, Dienste und Infrastrukturen in von Drittanbietern betriebene Cloud-Umgebungen umziehen.

Das Einstufen von Cloud-Anbietern als kritische Infrastruktur ist natürlich nicht nötig, wenn wir nur davon sprechen, den Zugang zu unseren Mails, Collaboration Services oder Dateifreigaben für einen relativ kurzen Zeitraum zu verlieren. Die größten Provider hosten aber mittlerweile auch teils gigantische IoT-Plattformen (Internet of Things) oder Bezahldienste für weltweit agierende Finanzorganisationen. Andere verarbeiten die Gesundheitsdaten von zahllosen Patienten oder werden zur Integration essenzieller Anwendungen benötigt.

Ein Beispiel dafür sind die Azure Health Data Services, die von großen Unternehmen wie Humana, SAS und anderen genutzt werden, um Daten von Patienten oder direkt aus der medizinischen Forschung zu verarbeiten. Ebenso nimmt der Anbieter AWS seit einer geraumen Weile verstärkt den Energiebereich mit Produkten ins Visier, die Modelle zur Erdölexploration und -bohrung sowie zur Überwachung der Förderung umfassen. Auch die Fahrzeugindustrie profitiert zunehmend von Googles Connected Car Telemetry Platform. Damit lassen sich Daten von selbstfahrenden oder mit Telemetrie ausgestatteten Autos sammeln und koordinieren.