alexkich - stock.adobe.com

Datenwiederherstellung: Der Einfluss künstlicher Intelligenz

Künstliche Intelligenz wird vermehrt in Wiederherstellungs-Tools eingesetzt, um durch umfassende Analysen die Datensicherung, Data Protection und Wiederherstellung zu optimieren.

Künstliche Intelligenz (KI) und maschinelles Lernen (ML) verändern die Art und Weise, wie Daten-Backups und -wiederherstellung in Unternehmens-, Cloud- und Rechenzentrumsumgebungen verwaltet werden. Ein wesentlicher Vorteil dieser Technologien ist ihre Fähigkeit, die Automatisierung voranzutreiben und den IT-Betrieb zu verbessern, ohne dass zahlreiche manuelle Eingriffe erforderlich sind.

Doch selbst mit KI-gestützten Backup- und Wiederherstellungs-Tools fehlt es Unternehmen oft an Transparenz hinsichtlich ihrer Daten. Für Unternehmen, die in generative KI-Systeme (GenAI) mit großen Datenmengen investieren, verschärft die mangelnde Transparenz die ohnehin schon komplexe Herausforderung des Datenmanagements. In der heutigen Wettbewerbslandschaft ist die Einbindung von KI und ML in das Datenlebenszyklusmanagement (DLM) zusammen mit einem soliden Datenwiederherstellungsplan ein Erfolgsrezept für Unternehmen.

Was ist KI-gestützte Datenwiederherstellung?

Unternehmen nutzen eine Vielzahl von Strategien zur Datenwiederherstellung, um verlorene Anwendungen, Daten und Dateisysteme wiederherzustellen. Zu diesen Ansätzen gehören die Replikation, geplante vollständige und inkrementelle Backups sowie Snapshot-basierte Methoden, die Änderungen des Workloads oder des Datenstatus erfassen, um eine kontinuierliche Data Protection (CDP) zu gewährleisten.

Herkömmliche Datenwiederherstellungsmethoden basieren auf der Zusammenarbeit mit Anbietern und komplexen manuellen Prozessen, deren Durchführung zeitintensiv sein kann. Ein Daten-Recovery kann je nach Datenmenge und -art wenige Minuten bis hin zu Tagen oder Wochen dauern. Eine Rolle spielt dabei auch die Komplexität der wiederherzustellenden Umgebung. Heutige KI-Datenwiederherstellungs-Tools integrieren zunehmend ML-Algorithmen und KI-Modelle, um Dateisysteme, Datenstrukturen, historische Muster und neue Bedrohungen zu analysieren. Diese Tools nutzen die Erkennung von Backup-Anomalien, um ungewöhnliche Änderungen der Datengröße oder des Datenverhaltens zu identifizieren, und wenden Mustererkennung an, um die selbstlernende Datenwiederherstellung und intelligente Datenrestaurierung kontinuierlich zu verbessern.

Eine Gartner-Studie geht davon aus, dass bis 2029 etwa 90 Prozent der Backup- und Data-Protection-Tools GenAI – einschließlich Chatbots und natürlicher Sprachverarbeitung (NLP) – integrieren, um Verwaltungs- und Supportfunktionen zu verbessern, verglichen mit weniger als 25 Prozent im Jahr 2025, so der Bericht von Gartner vom Juni 2025 über Backup- und Data-Protection-Plattformen. Darüber hinaus werden voraussichtlich 35 Prozent der Unternehmen autonome Backup-Systeme implementieren, die auf agentenbasierter KI basieren, verglichen mit weniger als 2 Prozent im Jahr 2025. Dies sind allerdings Prognosen, die auf dem derzeitigen Wissenstand über Markt und Technologien basieren und der tatsächliche Trend wird sich erst noch abzeichnen müssen.

Unternehmen müssen sicherstellen, dass Backup-Systeme alle kritischen Daten erfassen und schützen, einschließlich Systemkonfigurationen, Datenbanken, SaaS-Anwendungsdaten, Webseiten und Benutzerdateien, damit diese im Falle eines Systemausfalls oder einer Störung zuverlässig wiederhergestellt werden können. Allerdings besteht die Möglichkeit, dass einige Unternehmen Backup-Systeme einsetzen, ohne sie zu testen. Im Rahmen dieses Prozesses ist es wichtig, Fehlkonfigurationen sowie beschädigte oder unvollständige Datendateien zu erkennen, bevor die Systeme und Daten wiederhergestellt werden müssen. Spezielle Tools können dazu beitragen, die Datenintegrität und -verfügbarkeit sicherzustellen, sodass Benutzer bei Bedarf auf vertrauenswürdige Informationen zugreifen können.

 „Bei der Wiederherstellung besteht ein Großteil des Problems darin, Prioritäten zu setzen, was schnell wiederhergestellt werden muss“, sagt Jon Brown, Senior Analyst für Data Protection, Betrieb und Nachhaltigkeit bei der Enterprise Strategy Group, die jetzt zu Omdia gehört. Einige Unternehmen, so Brown, finden, dass KI ihnen bei der Entscheidung hilft: „In welcher Reihenfolge sollten wir diese Vorgänge durchführen? Was sollten wir zuerst wiederherstellen? Der andere wichtige Bereich ist einfach die Möglichkeit, mehr zu testen, KI zum Testen Ihrer Wiederherstellungen zu nutzen und einen Teil dieses Prozesses zu automatisieren.“

Abbildung 1: KI und Automatisierung sorgen in Kombination für die Optimierung von Backup- und Recovery-Prozessen.
Abbildung 1: KI und Automatisierung sorgen in Kombination für die Optimierung von Backup- und Recovery-Prozessen.

Der Einsatz von KI zur Verbesserung der automatisierten Backup-Validierung in Unternehmens-, SaaS- und Cloud-Umgebungen ist von entscheidender Bedeutung, insbesondere da Bedrohungen wie Ransomware auch in Zukunft den IT-Alltag begleiten. KI und ML werden zunehmend in Sicherheitssysteme integriert, um Umgebungen zu überwachen und Maßnahmen zu ergreifen, wenn Risiken wie Viren und Malware erkannt werden. Mehr als die Hälfte (51 Prozent) von 375 IT- und Datenexperten aus mittelständischen und großen Unternehmen in Nordamerika glauben, dass KI und ML ihre Fähigkeit zur Wiederherstellung von Daten nach Ransomware-Angriffen verbessern werden, so der Bericht Reinventing Backup and Recovery With AI and ML der Enterprise Strategy Group aus dem Jahr 2024.

KI-Tools können dabei helfen, eine komplizierte und zeitaufwändige Aufgabe zu rationalisieren, indem sie IT-Fachleuten ermöglichen, kompromittierte Dateninfrastrukturen und Dateisysteme zu lokalisieren und sie in ihren ursprünglichen Zustand vor dem Angriff zurückzuversetzen. Ein Ransomware-Angriff kann monatelang unentdeckt bleiben, insbesondere wenn der Angreifer ältere Dateien heimlich verschlüsselt.

„Im Allgemeinen hat man es bei der Wiederherstellung mit einem Datum zu tun: Hier ist alles schiefgelaufen“, erklärt W. Curtis Preston, ein Veteran im Bereich Data Protection (auch bekannt als Mr. Backup) und Autor, dessen neuestes Buch Learning Ransomware Response & Recovery erhältlich ist. „Bei einer kuratierten Wiederherstellung kann die KI sagen: Schauen wir uns einfach alle verschiedenen Dateien an und wählen wir automatisch die neueste Version jeder Datei aus, bevor sie verschlüsselt wurde“, so Preston. „Das manuell zu tun, ist eine riesige Qual, aber automatisch sollte es relativ einfach sein. Versuchen Sie nicht, Ihr Betriebssystem wiederherzustellen und diese Dinge neu aufzubauen. Versuchen Sie einfach, Ihre Datenbank und alle Ihre Dateien wiederherzustellen.“

Wie verändert KI den Lebenszyklus der Datenwiederherstellung?

Der Lebenszyklus der Datenwiederherstellung ist eine Schlüsselkomponente des Datenlebenszyklusmanagements – einer Strategie, die den Umgang mit Daten von der Erstellung bis zur Löschung durch Richtlinien und Schutzmaßnahmen für die Datenspeicherung und -nutzung regelt. Während der Datenwiederherstellung identifizieren und bewerten Unternehmen den Umfang eines Datenverlusts und implementieren dann einen Wiederherstellungsplan, um die Daten mithilfe von Backups und anderen Wiederherstellungs-Tools in ihren ursprünglichen Zustand zurückzuversetzen.

Die Art der Wiederherstellung – wie zum Beispiel Dateisystemwiederherstellung, Backup-Wiederherstellung, Festplatten- oder Partitionswiederherstellung und Rohdatenwiederherstellung – hängt von der Art und Schwere des Vorfalls ab. Es ist wichtig, vor der Wiederaufnahme des Betriebs zu überprüfen, ob die wiederhergestellten Daten vollständig, korrekt und voll funktionsfähig sind. Unternehmen benötigen außerdem Systeme zur Überwachung und Sicherung der Daten und zur Verhinderung weiterer Verluste.

KI-Tools ermöglichen es Unternehmen zunehmend, über die grundlegende Wiederherstellung hinauszugehen, indem sie Systemausfälle prognostizieren, Wiederherstellungs-Workflows automatisieren und Backup-Strategien sowie die Ressourcenzuweisung optimieren. Obwohl sich viele dieser Funktionen noch in der Entwicklung befinden, können KI-gestützte Tools die Datenwiederherstellung auf verschiedene Weise unterstützen.

Vorhersage von Ausfällen

Datensicherheits-Tools verwenden historische und Echtzeitdaten sowie statistische und ML-Algorithmen, um prädiktive Analysen durchzuführen. Diese Technologien analysieren Protokolle, historische Daten, Leistungsinformationen, Dokumentationen und Echtzeit-Sensordaten, um Gerätemodelle zu erstellen und potenzielle Risiken und Ausfälle zu erkennen. KI-gestützte Tools wie prädiktive Datenwiederherstellungssysteme ermöglichen es Unternehmen außerdem, Backups und Failovers zu automatisieren, um Daten zu schützen.

Erkennung von Anomalien

KI-gesteuerte Tools überwachen den Netzwerkverkehr mithilfe von ML und Datenanalysen, um normales Verhalten und Muster auf der Grundlage historischer Daten zu analysieren. So kann die Software unter anderem Abweichungen erkennen, die auf potenzielle Sicherheitsvorfälle, Malware oder Datenverletzungen hindeuten könnten.

„Ein Großteil der Fähigkeit, sich von Ransomware-Angriffen zu erholen, besteht darin, diese frühzeitig zu erkennen“, so Brown. Immer mehr Produkte integrieren KI-basierte Anomalieerkennung. Dabei handelt es sich nicht nur um statische, signaturbasierte KI zur Erkennung von Ransomware, sondern um dynamische, verhaltensbasierte Analysen. KI-Funktionen werden vermehrt in Sicherheits-Tools integriert, um wichtige Fragen zu beantworten, wie zum Beispiel: Versucht jemand, etwas mit unseren Backup-Daten zu tun?

Abbildung 2: KI kann einen großen Beitrag dazu leisten, die Vorteile der Datensicherung und -wiederherstellung zu maximieren und die damit verbundenen Herausforderungen zu minimieren.
Abbildung 2: KI kann einen großen Beitrag dazu leisten, die Vorteile der Datensicherung und -wiederherstellung zu maximieren und die damit verbundenen Herausforderungen zu minimieren.

Automatisierung von Wiederherstellungs-Workflows

KI und ML können dabei helfen, Backup-Daten effizienter zu klassifizieren, darauf zuzugreifen und wiederherzustellen. Die Enterprise Strategy Group berichtet, dass 46 Prozent der befragten IT-Fachleute erwarten, dass GenAI bei der Erstellung von Datenwiederherstellungsplänen hilft und damit einen Prozess rationalisiert, der traditionell manuell und zeitaufwändig ist. Ein GenAI-Tool könnte beispielsweise automatisch einen schrittweisen Wiederherstellungsplan erstellen, der auf der Infrastruktur des Unternehmens, den Datenklassifizierungsrichtlinien und den jüngsten Backup-Aktivitäten basiert – dabei werden priorisierte Systeme identifiziert, Wiederherstellungspunkte empfohlen und potenzielle Lücken in der Backup-Abdeckung markiert.

Die meisten dieser Pläne enthalten wichtige Leistungsindikatoren (Key Performance Indicator, KPI). Das Recovery Point Objective (RPO) definiert den maximal akzeptablen Datenverlust, während das Recovery Time Objective (RTO) sich auf die Ausfallzeit bezieht, die ein Unternehmen ohne erhebliche Störungen tolerieren kann. Während des Planungsprozesses können IT-Fachleute die von Anbietern bereitgestellten aggregierten Daten vergleichen, so Brown. Sie können auch synthetische KI-Daten verwenden, um ihre eigene automatisiertes Disaster Recovery mit KI-Szenarien durchzuführen.

In Zukunft könnten KI-Wiederherstellungs-Tools autonome End-to-End-Wiederherstellungs-Workflows orchestrieren, optimale Wiederherstellungspunkte auswählen, Infrastruktur bereitstellen, die Datenintegrität validieren und Failover mit minimaler menschlicher Überwachung durchführen.

Optimierung der Backup-Planung und Priorisierung

KI-Tools können Unternehmen dabei helfen, Ressourcen effizienter zuzuweisen, indem sie Backup-Strategien und -Infrastrukturen wie Netzwerknutzung und Cloud- versus On-Premises-Speicher analysieren und mit Leistungskennzahlen und Daten von Anwendungs- und Cloud-Dienstleistern vergleichen. Diese Strategien können Datendeduplizierung, Datenkomprimierung und mehrstufige Speicheroptionen umfassen. Amazon Web Services, Microsoft Azure und andere Hyperscaler bieten zeitlich geplante Backup- und Wiederherstellungsdienste für virtuelle Maschinen, Datenbanken und Dateien sowie Unterstützung für mehrstufige Speicherung zur Optimierung von Kosten und Leistung.

Validierung der Datenintegrität

Unternehmen implementieren verschiedene Kontrollen, Technologien und Prozesse, um die Datenintegrität während des gesamten Lebenszyklus aufrechtzuerhalten. Viele Unternehmen folgen dem Rahmenwerk ISO/IEC 27001, das die Vertraulichkeit, Integrität und Verfügbarkeit von Informationen in den Vordergrund stellt. Um die Integrität von Backup-Daten zu überprüfen, bevor sie für die Wiederherstellung benötigt werden, können Backup-Administratoren ausgewählte Dateien an einen anderen Speicherort verschieben und mit den Originalen vergleichen. Um die Integrität und Nutzbarkeit der Daten nach der Wiederherstellung zu überprüfen, können Hash-Abgleich, Prüfsummen und KI-Validierungs-Tools sicherstellen, dass die Daten vollständig und korrekt sind.

„In größeren Cloud-nativen Umgebungen sehen wir zunehmend, dass künstliche Intelligenz eingesetzt wird, um Wiederherstellungsumgebungen automatisch hochzufahren. Dies wird als Datenrehydrierung bezeichnet“, erklärt Bill Kleyman, CEO und Mitbegründer des KI-Plattformanbieters Apolo und Executive Chair der Informa/AFCOM-Programme für Rechenzentrums- und IT-Fachleute. KI-Tools können dabei helfen, archivierte oder selten aufgerufene Daten auf eine höhere Leistungsebene wiederherzustellen, wodurch die Daten im Wesentlichen rehydriert werden, um ihre Integrität zu überprüfen.

„Im Grunde genommen kann das, was früher manuell Stunden gedauert hat, jetzt in wenigen Minuten erledigt werden – die gesamte Orchestrierung für einen Standort, für einen Edge-Standort, alles in dieser Richtung“, betont Kleyman. „KI kann Risiken aufzeigen. Sie ist nicht dazu da, Menschen zu ersetzen, daher bleibt die menschliche Validierung weiterhin entscheidend. Man muss einen Menschen in den Prozess integrieren. Man kann nicht einfach die Schlüssel komplett der KI übergeben.“

Herausforderungen und Risikofaktoren von KI bei der Datenwiederherstellung

Viele Unternehmen sind besorgt über die Datenschutz- und Compliance-Risiken, die mit der KI-gesteuerten Datenwiederherstellung verbunden sind. Die Integration von KI in Datenwiederherstellungsprozesse birgt technische und betriebliche Risiken, darunter die Notwendigkeit hochwertiger Trainingsdaten zur Gewährleistung der Genauigkeit, das Risiko von KI-generierten Halluzinationen und Bedenken hinsichtlich der Sicherheitspraktiken von Drittanbietern. Unternehmen können bei der Einführung KI-gestützter Tools mit mehreren Herausforderungen konfrontiert sein, darunter die folgenden:

  • Hochwertige Modelltrainingsdaten. Wie alle KI-Systeme basiert auch die KI-gesteuerte Datenwiederherstellung auf ML-Algorithmen und hochwertigen Trainingsdaten, darunter gekennzeichnete Datensätze und reale Ausfallszenarien, um sicherzustellen, dass die Wiederherstellungsprozesse genau, effektiv und zuverlässig sind. „Es ist ein Mehrwert, sich auf das Fachwissen der Anbieter und ihre Fähigkeit zu verlassen, Tausende von Umgebungen zu überblicken“, sagt Brown. Die Enterprise Strategy Group berichtete, dass 59 Prozent der IT- und Datenexperten davon ausgehen, dass sie aufgrund von Datenverlusten, Beschädigungen oder Änderungen in der Infrastruktur mit hohen Kosten für die Neuerstellung von KI-Modellen konfrontiert sein werden. Diese Herausforderungen könnten einige Unternehmen dazu veranlassen, ihre Anbieter neu zu bewerten, insbesondere wenn Backup-Systeme die für die Pflege und das Re-Training von KI-Modellen erforderlichen Trainingsdaten nicht schützen können.
  • Risiko von KI-Halluzinationen. ML-Algorithmen könnten Daten fälschen oder falsch identifizieren, was dazu führt, dass das KI-gestützte Tool Dateien ungenau rekonstruiert und wiederherstellt. Wenn die Trainingsdaten im ML-Modell verzerrt oder unvollständig sind, könnte das Datenwiederherstellungs-Tool auf der Grundlage kompromittierter Eingaben lernen und sich anpassen. KI-Halluzinationen können auch zu KI-gesteuerten Disaster-Recovery-Plänen führen, die falsche Daten-Backup- und Systemwiederherstellungsprozesse priorisieren.
  • Sicherheitsrisiken in der Lieferkette und bei Drittanbietern. Die Datenwiederherstellung ist komplexer, wenn Drittanbieter beteiligt sind, insbesondere wenn deren Kontrollen versagen und es zu einer Sicherheitsverletzung oder einem Verstoß gegen Compliance-Vorschriften kommt. Unternehmen bleiben für Datenschutz- und Sicherheitsverletzungen verantwortlich, die durch Drittanbieter verursacht werden, die über KI-Modelle und verwandte Tools mit ihren Daten interagieren.
  • Qualifikationslücke. Zusätzlich zu den Hardware- und Softwarekosten für die Implementierung von KI für Backup und Datenwiederherstellung erfordert die Einrichtung und Wartung dieser Systeme Fachwissen in den Bereichen KI und ML – Fähigkeiten, über die viele IT- und Rechenzentrumsfachleute oft nicht verfügen. Diese Lücke kann ein erhebliches Hindernis für die Einführung und den effektiven Einsatz von KI in Recovery-Strategien darstellen.
  • Einhaltung der Gesetze zur Datenwiederherstellung. Der Einsatz von KI-Datenwiederherstellungs-Tools muss den Data-Protection- und Compliance-Vorschriften entsprechen. Unternehmen müssen in der Lage sein, sensible Daten zu identifizieren und zu klassifizieren und die Branchenvorschriften einzuhalten, darunter HIPAA, PCI DSS, DSGVO, CCPA und NIS2. Und gemäß den strengen Richtlinien des Digital Operational Resilience Act (DORA) der EU müssen Unternehmen die Anforderungen für die Wiederherstellung von Daten-Backups, -duplikaten, -aufbewahrung und -löschung erfüllen sowie Redundanzmaßnahmen implementieren, um den Betrieb bei Systemausfällen oder Katastrophen aufrechtzuerhalten.
Abbildung 3: In Verbindung mit KI verspricht Quantencomputing eine wichtige Rolle bei der Datensicherung und -wiederherstellung zu spielen.
Abbildung 3: In Verbindung mit KI verspricht Quantencomputing eine wichtige Rolle bei der Datensicherung und -wiederherstellung zu spielen.

Wie sieht die Zukunft der KI-gesteuerten Datenwiederherstellung aus?

Anbieter integrieren KI-gesteuerte Tools für die Erkennung von Anomalien, die vorausschauende Fehleranalyse und die Optimierung von Richtlinien in ihre Plattformen in hybriden Umgebungen – lokale Systeme und Public-Cloud-Dienste – und nutzen APIs, um Backups und Recoveries zu automatisieren und zu koordinieren.

Gartner nimmt an, dass 75 Prozent der Unternehmen bis 2029 ein einheitliches Backup- und Wiederherstellungssystem für lokale und Cloud-Daten verwenden werden, gegenüber 25 Prozent im Jahr 2025. „Wir treten in eine neue Ära der Information ein – eine Ära mit Modellen, Checkpoints und Protokollen“, sagt Kleyman. „KI treibt nicht nur das Geschäft voran, sondern hat nun auch eigene Anforderungen an Backup und Wiederherstellung.“ KI-Trainingsdaten, insbesondere für GenAI, müssen gesichert werden, um Datenverluste zu vermeiden und die Modellentwicklung zu schützen.

Laut Enterprise Strategy Group gaben jedoch fast zwei Drittel der IT- und Datenexperten an, dass ihre Unternehmen nur die Hälfte ihrer KI-generierten Daten sichern. Zu den wichtigsten Gründen für die Sicherung dieser Daten gehören Datenschutz, Compliance, Redundanz und die Möglichkeit, sie zu validieren und zu testen. Diese Lücke bei der Sicherung von KI-Daten birgt ernsthafte Sicherheitsrisiken, insbesondere für Unternehmen ohne Prozessautomatisierung, da Datenverluste zu kostspieligen Neu-Trainings der Modelle führen können.

Unternehmen planen im Wesentlichen für das Unbekannte, wenn es um Sicherung und Wiederherstellung geht, meint Brown. Die Art der nächsten Sicherheitsverletzung sei nicht vorhersehbar, sagt er und fügt hinzu, dass KI als vertrauenswürdiger Berater dienen könne, da sie praktische Erfahrungen und fundierte institutionelle Kenntnisse über das Unternehmen sammle. „Das Problem ist, dass wir im Durchschnitt vier große Notfallübungen pro Jahr durchführen, wenn es um Data Protection geht“, räumt Brown ein. In solchen Situationen sei es hilfreich, über eine KI zu verfügen, die „solche Vorkommnisse bereits einmal gesehen hat“ und bei der Bewältigung der Situation helfen kann.

Erfahren Sie mehr über Backup-Lösungen und Tools