InfiniteFlow - stock.adobe.com

Wird agentische KI Disaster-Recovery transformieren?

Vorbehalte gegenüber autonomer KI bei Disaster Recovery sind oft nicht auf mangelnde Leistung zurückzuführen, sondern auf Fragen des Vertrauens und der Verantwortlichkeit.

Disaster Recovery war schon immer der letzte Bereich der IT, der modernisiert wurde, und ehrlich gesagt gibt es dafür einen Grund. Wenn eine Katastrophe eintritt und Kunden Ihr Postfach überfluten, möchte kein IT-Leiter darauf wetten, ob ein KI-Agent korrekt verstanden hat, welche kritischen Ressourcen priorisiert werden müssen oder welcher Load Balancer wiederhergestellt werden muss, um den Produktionsbetrieb wieder in einen gesunden Zustand zu bringen.

Ich habe 15 Jahre lang mit Cloud-Backup- und Disaster-Recovery-(DR)-Teams gearbeitet und ihnen geholfen, ihre Verfahren weiterzuentwickeln, und ich kann die Skepsis innerhalb dieser CloudOps-Teams bestätigen. Sie haben gute Gründe, zu zögern, auf den Zug der agentischen KI aufzuspringen.

Aber im Moment beobachte ich, wie dieses Zeitfenster des Zögerns beginnt, sich zu schließen.

Zwei Jahrzehnte Cloud, ein Arbeitsmodell

Wir haben seit fast 20 Jahren Cloud-Infrastrukturen. Unternehmen sind von Bandlaufwerken zu Object Storage übergegangen, haben Multi-AZ-Replikation (Availability Zones) aufgebaut, Snapshot-basierte Aufbewahrung eingeführt und Petabytes aus dem eigenen Rechenzentrum ausgelagert. Der Technologie-Stack hat sich schnell verändert, und neue Services sind in rasantem Tempo entstanden. Aber das Betriebsmodell hat sich kaum verändert.

Zum Beispiel kann ich garantieren, dass jemand in Ihrem Backup- und Disaster-Recovery-Team immer noch manuell Cloud-Ressourcen taggt. Wenn das Budget ein Thema ist (und das ist es meistens), schreibt ein Teammitglied immer noch einmalige Skripte mit mangelhafter Dokumentation, um kalte Daten (Cold Data) in günstigere Storage-Tiers zu verschieben. Und irgendwo sitzt genau jetzt ein sehr müder Ingenieur, der um 2 Uhr morgens geweckt wurde, um sich aufgrund einer Health-Degradation-Warnung eines Hyperscalers in eine Backup-Konsole einzuloggen und die richtigen Knöpfe zu drücken, Verbindungen zu validieren sowie zu bestätigen, dass die Integritätsprüfungen der Daten bestanden wurden, bevor der Rest seiner Kollegen aufgewacht ist.

Die Technologie hat sich weiterentwickelt, aber das Arbeitsmodell steckt immer noch in den frühen 2000er-Jahren fest, als die Cloud gerade erst Pionierarbeit leistete. Genau diese Lücke kann von agentischer KI geschlossen werden.

Was agentische KI tatsächlich auf den Tisch bringt

Wenn ich über agentische KI im Kontext von Disaster Recovery spreche, meine ich nicht ein intelligenteres Dashboard oder von KI generierte DR-Runbooks (auch wenn diese sicherlich später kommen werden). Agentische KI wird sich zunächst darauf konzentrieren, Systeme zu automatisieren, die autonom handeln können, ohne einen Menschen im Prozessablauf, und sie wird dies in den fünf Bereichen tun, die mehr Arbeitsstunden von DR-Teams beanspruchen als alles andere:

Automatisiertes Ressourcen-Tagging

Heute nimmt die manuelle Klassifizierung zur Identifizierung kritischer oder abteilungsbezogener Ressourcen viele Stunden in Anspruch. Agentische Systeme können Ressourcen automatisch identifizieren und klassifizieren.

Kontinuierliche Sicherheitsvalidierung

Anstatt geplanter Compliance Audits, die Probleme erst im Nachhinein entdecken, können KI-Agenten Ihre Umgebung in Echtzeit überwachen — und Fehlkonfigurationen markieren, bevor sie zu Wiederherstellungsrisiken werden.

Selbstständig ausgeführte Wiederherstellung

Das ist der große Punkt. Recovery-Workflows können automatisch ausgelöst und abgeschlossen werden, ohne dass jemand unter Druck um 3 Uhr morgens jeden Schritt manuell validieren muss.

Adaptive Backup-Strategien

Backup-Frequenz und geografische Replikation können sich dynamisch an tatsächliche Nutzungsmuster und Risikosignale anpassen, statt an statische Zeitpläne, die jemand vor zwei Jahren festgelegt hat.

Autonome Kostenoptimierung

Ältere Backups können kontinuierlich in günstigere Storage-Tiers verschoben werden, ohne manuelle Überwachung — wobei Kosten und Aufbewahrungsanforderungen laufend ausbalanciert werden.

Nichts davon ist Science-Fiction. Wir sehen bereits agentische Fähigkeiten in angrenzenden IT-Bereichen im Einsatz. Die Technologie ist reif genug. Warum bewegt sich Disaster Recovery also nicht?

Die eigentliche Barriere ist Vertrauen, nicht Technologie

Laut einer Deloitte-Umfrage unter KI-Führungskräften aus dem Jahr 2025 waren die größten Hindernisse für die Einführung agentischer KI die Integration von Altsystemen sowie Risiko- und Compliance-Bedenken: fast 60 Prozent der Befragten nannten beide Punkte. Im Bereich Disaster Recovery werden diese Bedenken durch eine unbequeme Wahrheit verstärkt: Eine fehlgeschlagene agentische Aktion in DR bedeutet nicht nur eine verzögerte Bereitstellung. Sie kann dauerhaften Datenverlust, Compliance-Verstöße und Kundenabwanderung bedeuten.

Dieses Risikoprofil verändert alles. Deshalb haben so wenige DR-Teams überhaupt ernsthaft Budgets für KI eingeplant. Sie haben beobachtet, wie andere Abteilungen generative KI genutzt haben, ohne dass sich der erwartete Return on Investment (ROI) materialisiert hat. Sie haben die Schlagzeilen gesehen. Sie werden nicht das Team sein, das sich durch Automatisierung in einen katastrophalen Ausfall manövriert.

Was tatsächlich etwas verändern wird, ist keine Demonstration von Fähigkeiten. Es ist ein Proof of Concept (PoC) mit klar definierten Leitplanken — autonome Aktionen, die innerhalb von Richtliniengrenzen eingeschränkt sind, Audit-Trails, die Compliance-Teams zufriedenstellen, und Wiederherstellungsergebnisse, die korrekt funktionieren, nicht nur schneller. Führungskräfte müssen sehen, dass es funktioniert, bevor sie zustimmen, den Menschen aus den Prozessabläufen zu entfernen.

Das Verantwortungsproblem, über das niemand spricht

Selbst über Technologie und Compliance hinaus gibt es einen kulturellen Wandel, der meiner Meinung nach schwieriger ist als alles andere. Wenn ein agentisches System um 2 Uhr morgens Ihre Recovery-Architektur neu konfiguriert und etwas schiefgeht, wer trägt dann die Verantwortung für dieses Ergebnis?

Eine fehlgeschlagene agentische Aktion in DR bedeutet nicht nur eine verzögerte Bereitstellung. Sie kann dauerhaften Datenverlust, Compliance-Verstöße und Kundenabwanderung bedeuten.
Catalin Voicu, Cloud Solution Engineer, N2W

Die Antwort ist nicht offensichtlich, und die meisten Organisationen sind darauf nicht vorbereitet. Ingenieure wechseln von Operatoren zu Validierern. Architekten werden zu Hütern von Richtlinien. Die Verantwortungsstruktur verändert sich grundlegend — und diese organisatorische Neuausrichtung dauert länger als jede Softwarebereitstellung.

Deshalb wird Disaster Recovery anderen Bereichen hinterherhinken. Nicht, weil die künstliche Intelligenz (KI) es nicht kann, sondern weil Vertrauen und Verantwortlichkeit parallel zur Automatisierung neu gestaltet werden müssen.

Die Resilienz-Lücke kommt

Es mag ein paar Jahre länger dauern als in anderen Teilen der IT, aber die Unternehmen, die herausfinden, wie man autonomes Disaster Recovery nicht nur automatisiert, sondern steuert und regelt, werden einen echten und nachhaltigen Resilienzvorteil haben. Diejenigen, die das nicht tun, werden immer noch jemanden haben, der Ressourcen manuell taggt, wenn der nächste große Ausfall eintritt.

Die Lücke ist real. Die Technologie ist bereit. Die Frage ist jetzt, ob die Organisationen es sind.

Über die Autorin:
Catalin Voicu ist Cloud Solutions Engineer bei N2W.

Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.

Dieser Artikel ist im Original in englischer Sprache auf Search Disaster Recovery erschienen.

Erfahren Sie mehr über Cloud Storage