Feature

Wie Backups sich zu Datenmanagement entwickeln

Eine Studie ergab, dass Unternehmen die Notwendigkeit einer intelligenten Datenverwaltung erkennen. Somit müssen Backup-Produkte sich weiter entwickeln und Datenmanagement bieten.

von

Johnny Yu

Zuletzt aktualisiert: 04 Aug. 2020

Mit wachsendem Datenvolumen und wachsender Bedeutung der Informationen muss sich auch die Art und Weise ändern, wie Unternehmen mit ihren Daten umgehen.

Mehrere in diesem Jahr durchgeführte Umfragen zeigen, wie dies geschieht. Eine Veränderung besteht darin, dass viele Unternehmen bereits den Sprung von der reinen Datensicherung (Backup) zur Datenwiederverwendung vollzogen haben. Eine andere ist, dass sie Schritte unternehmen, um Daten besser zu indexieren und zu klassifizieren, wenn sie in den Petabyte-Bereich wachsen.

Eine Umfrage des IT-Analystenunternehmens Enterprise Strategy Group (ESG) mit dem Titel The Evolution from Data Backup to Data Intelligence (Die Entwicklung von der Datensicherung zur Datenintelligenz) verdeutlichte den Trend zur Datenwiederverwendung.

In der webbasierten Umfrage wurden 359 nordamerikanische IT-Experten mit Datenschutzverantwortung Fragen zur sekundären Datenwiederverwendung gestellt, und 42 Prozent verwendeten bereits sekundäre Daten für Cybersicherheits-Tests. Weitere 41 Prozent gaben an, dass sie Sekundärdaten für die Anwendungsentwicklung verwenden. Denselben Bereichen wurde ein hohes Potenzial für positive Auswirkungen auf das Geschäft bescheinigt.

Eines der wichtigsten Ergebnisse war, dass es keine allgemein anerkannte Definition für den Begriff „Datenmanagement“ gibt. Christophe Bertrand, Senior Analyst bei ESG und Autor der Studie, erklärt, dass IT-Fachleute „Datenmanagement“ als etwas verstehen, das sie tun wollen, auch wenn sie sich nicht darüber einig sind, was genau dies bedeutet.

Weniger als ein Viertel – 22 Prozent – sagten, der Begriff beziehe sich auf die Optimierung der Datenspeicherung und des Datenzugriffs, 19 Prozent deklarierten, es gehe um die Implementierung von Compliance- und Datenschutzprozessen und 11 Prozent sagten, es gehe um die Klassifizierung von Daten.

„Die Menschen haben eine vage Vorstellung von 'Datenmanagement' als Begriff, aber es ist nicht wirklich für jeden klar“, meint Bertrand.

Bertrand betont, Unternehmen wüssten, dass es eine „Kluft im Datenmanagement“ gebe, die sie überwinden müssten, um breitere Geschäftsergebnisse aus ihren Backup-Daten zu erzielen. Aber der Begriff „Datenmanagement“ ist verschwommen, was es ihnen schwerer macht, diese Kluft zu überwinden. Bertrand sagt, dies sei der Grund, warum er den Begriff „intelligentes Datenmanagement“ vorschlug, um die Kategorie zu beschreiben und eine klarere Definition dessen zu geben, was die Technologie leisten kann.

Die Lücke schließen – Veränderungen wagen

Die ESG-Umfrage ergab, dass viele Unternehmen die Vorteile erkennen, die sich aus der Überwindung dieser Kluft ergeben: 29 Prozent gaben an, dass sie durch die Wiederverwendung von Sekundärdaten eine größere geschäftliche Agilität erreichen könnten, 28 Prozent sagten, sie könnten die Betriebskosten senken und 25 Prozent sind sicher, es würde ihre Widerstandsfähigkeit gegenüber Cyberangriffen erhöhen. Zu den weiteren berichteten Vorteilen gehörten eine verbesserte Betriebszeit des Unternehmens und eine bessere Position, um mit dem schnellen Datenwachstum fertig zu werden.

Die sekundäre Datenwiederverwendung für Test- und Entwicklungszwecke ist ein anerkannter Trend in der Backup-Branche, dem einige Anbieter bereits folgen. Actifio hat sich bewusst darum bemüht, seine Copy-Data-Management-Fähigkeiten an die Test-/Dev-Anwender zu verkaufen, obwohl die Datensicherung ihr primärer Anwendungsfall bleibt. Cohesity hat ein Add-on zu seinem Flaggschiff DataPlatform namens Agile Dev and Test herausgebracht, das saubere Datenkopien für Test-/Dev-Teams bereitstellt, mit denen sie arbeiten können.

Die Umfrage zeigte auch eine starke Verbindung zwischen Datenschutz und Datenwiederverwendung auf, da 59 Prozent der Befragten angaben, dass die Datenwiederverwendung eine Erweiterung ihrer Datenschutzstrategie sei. Weitere 21 Prozent bestätigten, sie sei ein Ersatz für den Datenschutz.

Bertrand sagt, dass viele Backup-Anbieter jetzt Datenmanagement irgendwo in ihren Marketing-Slogans haben. Er verweist auf die Übernahme der Firma Veeam von Insight Partners. Diese zeige, wie viel Aktivität und Investorenvertrauen es auf dem Backup-Markt gebe.

„Die Anwender erkennen jetzt: 'Ich muss und möchte mehr tun'“, so Bertrand über die Reaktion der Organisationen auf den Datenschutz. „Es gibt immer noch einiges an Aufklärung zu tun. Die Unternehmen sehen oder verstehen den ROI noch nicht“, meint Bertrand.

Unstrukturiertes Datenwachstum erschwert die Klassifizierung

Die Firmen haben sicherlich mehr Daten, insbesondere unstrukturierte Daten. Der Datenschutzanbieter Igneous Systems hat eine Umfrage gesponsert, in der die Teilnehmer von AWS re:Invent nach ihren Problemen bei der Verwaltung unstrukturierter Daten befragt wurden. Die von Connect Marketing im Dezember 2019 durchgeführte Studie mit dem Titel Rise of the Data Economy ergab, dass 60 Prozent von 157 Befragten angaben, mehr als eine Milliarde Dateien zu verwalten. Es überrascht nicht, dass 70 Prozent der Befragten sagten, dass die Verwaltung unstrukturierter Daten in diesem Umfang schwierig sei.

Die Studie wies auf das Wachstum datenintensiver Industrien wie autonome Fahrzeuge und genetische Sequenzierung als einen der Gründe für die Explosion unstrukturierter Daten hin. Im Beispiel der DNA-Sequenzierung kann eine einzige Maschine bis zu zwei Terabyte pro Lauf erzeugen. Schätzungen zufolge wird die Industrie bis 2025 zwei Milliarden Genome sequenzieren, was etwa 200 Exabyte an unstrukturierten Daten entspricht.

„Die Ressourcen wurden in der vorherigen Generation nicht gebaut, um so hoch skalieren zu können“, erläutert Christian Smith, Vizepräsident für Produkte bei Igneous Systems.

Die ESG-Studie ergab, dass 62 Prozent der Befragten Daten mit Hilfe von Datenschutz-Tools klassifizieren, aber Smith warnt, dass es nicht ausreicht, Petabytes von Daten nur während des Backup-Prozesses zu markieren. Er ist der Meinung, dass die Datenklassifizierung allgegenwärtiger sein sollte und dass Datenmanagement in großem Maßstab volle Transparenz erfordert – quasi ein „Dashboard mit Überblick über alles, was man als Firma hat“.

Quantum Spatial, ein Unternehmen für die Analyse von Geodaten mit Niederlassungen in den Vereinigten Staaten, wurde im Januar 2019 zu einem Kunden von Igneous, weil seine bisherige manuelle Methode zur Verfolgung der Speicheraufnahme nicht nachhaltig war. Travis Spurley, leitender Systemingenieur bei Quantum Spatial mit Sitz in Portland, Oregon, verwaltet etwa zehn Petabyte an Daten in Primär- und Sekundärspeichern und verzeichnet einen Datenzuwachs von 40 Terabyte pro Woche. All diese Daten sind unstrukturiert und umfassen LIDAR-Messungen, topographische und Wassertiefenmessungen sowie Luftaufnahmen von Firmenflugzeugen.

Spurley führt an, die Verfolgung all dieser Daten sei ein akribischer und mühsamer Prozess. Ein Administrator würde die von der primären Speicherplattform generierten Berichte verwenden und sich die Unterschiede von Woche zu Woche ansehen, um die Speicherauslastung mit laufenden Vermessungsprojekten zu verknüpfen.

Die Ineffizienzen entstanden am Projektende – die Daten blieben länger als nötig im Primärspeicher, bevor sie für die Archivierung identifiziert werden konnten. Da bis zu einem Dutzend Projekte gleichzeitig liefen, wuchsen die zusätzlichen Speicherkosten laut Spurley schnell.

Spurley meint, dies sei letztlich ein Problem des Datenlebenszyklus-Managements (Data Lifecycle Management), das zu unnötigen Kosten führe. „Automatisierung und Effizienz sind der Schlüssel für jedes erfolgreiche Unternehmen“, betont er.

Seit dem Einsatz von Igneous hat Quantum Spatial dank seines skalierbaren Index besser verstanden, wie es mit dem Datenlebenszyklus, der Datensicherung und der Archivierung umgeht. Anstatt auf externen Festplatten zu archivieren, nutzt das Unternehmen jetzt die Public Cloud.

Spurley sagt, dass Igneous' Indexierung es seiner Organisation schließlich ermöglicht habe, sich mit dem Löschen von Daten vor Ort vertraut zu machen, sobald sie bestätigt hätten, dass eine Kopie davon sicher in der Cloud liegt.

Spurley gibt an, jetzt, da die Kernkomponente der Indizierung vorhanden sei und er über die allgegenwärtige Datenklassifizierung verfüge, die Bertrand beschrieben habe, freue er sich darauf, diese intelligent zu nutzen. Er sagt, eine Analysefähigkeit würde es ihm ermöglichen, die Kosten für jedes Projekt zu kalkulieren, was ihm nützliche Geschäftseinblicke verschaffen würde.

Weitere Hürden

Bertrand stimmt dem zu, dass eine intelligente Datenverwaltung eine allgegenwärtige Klassifizierung der Daten erfordere. Wenn Daten nicht getaggt und durchsuchbar sind, dann sind sie nicht kontext- oder inhaltsbezogen. Die Umfrage ergab, dass nur 35 Prozent der Befragten alle ihre Daten klassifizieren und 29 Prozent nur unstrukturierte Daten klassifizieren. Unternehmen, die alle ihre Daten klassifizieren, berichteten von einem höheren Vertrauen in Geschäftsentscheidungen und Compliance-Audits.

Interessanterweise identifizierte die ESG-Umfrage die Cloud als eines der größten Hindernisse für eine allgegenwärtige Datenklassifizierung. 57 Prozent Prozent der Befragten gaben an, dass die Nutzung von öffentlichen Cloud-Computing-Diensten wie SaaS-Anwendungen und IaaS-Angebote die Klassifizierung von Daten erschwert hat.

Die von diesen Off-Premises-Quellen erzeugten Daten befinden sich in separaten Silos, die sich häufig außerhalb der Reichweite herkömmlicher Backups befinden. Da 62 Prozent der Umfrageteilnehmer, die ihre Daten klassifizieren, dies über ihre Datenschutz-Tools tun, ist dies eine echte Herausforderung.

Schließlich sind der mangelnde ROI und der interne Widerstand gegen Änderungen weitere Gründe, warum Unternehmen nicht bereit sind, intelligente Datenverwaltungsprodukte einzusetzen. Ein Viertel der Befragten gab an, dass sie die Vorteile einer aktiven Datenverwaltung nicht sehen, 23 Prozent erklärten, dass sie ihren Primärspeicher nicht ändern möchten und 22 Prozent sagten, dass sie ihre aktuellen Backup-Konfigurationen nicht ändern möchten.

Bertrand sagt, dass Silos innerhalb von Organisationen es schwer machen können, die Vorteile eines intelligenten Datenmanagements zu erkennen. Als Beispiel führt er an, dass eine DevOps-Person erkennt, wie der Zugriff auf saubere Testdaten zu schnelleren Entwicklungszyklen führt, aber jemand, der in der Datensicherung arbeitet, vielleicht nicht.

Wie Backups sich zu Datenmanagement entwickeln

Eine Studie ergab, dass Unternehmen die Notwendigkeit einer intelligenten Datenverwaltung erkennen. Somit müssen Backup-Produkte sich weiter entwickeln und Datenmanagement bieten.

Die Lücke schließen – Veränderungen wagen

Unstrukturiertes Datenwachstum erschwert die Klassifizierung

Weitere Hürden

Erfahren Sie mehr über Backup-Lösungen und Tools

KI: Diese Herausforderungen müssen Storage-Admins meistern

Mit Backups Datenverlust bei Naturkatastrophen vermeiden

Backup as a Service: Die wichtigsten Vorteile

Die wichtigsten Fragen zu Kubernetes-Backups erklärt