
stokkete - stock.adobe.com
5 Schritte für eine klare Archivierungspraxis von Daten
Primary Storage ist teuer und begrenzt. Für die Archivierung von Daten müssen die IT-Administratoren deshalb nach günstigen, strukturierten Lösungen suchen.
Fast jeder Storage-Manager sieht sich mit dem laufenden Problem konfrontiert, wie man die ständig wachsenden Daten aufnimmt und speichert. Primary Storage ist tendenziell teuer und besitzt nur begrenzte Kapazitäten, so dass die meisten Unternehmen ältere Daten in ein Archiv verschieben. Diese Praxis macht Platz auf den primären Speichersystemen eines Unternehmens für neue Daten.
Oberflächlich betrachtet ist das Konzept der Datenarchivierung einfach. In der Praxis erweist es sich oft als ziemlich herausfordernd. Sorgfältige Planung ist erforderlich, bevor die ersten Datenstücke verschoben werden, so dass man unsere fünf Ratschläge befolgen sollte, um eine vernünftige Archivierungspraxis von Daten zu schaffen.
1. Identifizieren und Sortieren der Daten, die archiviert werden sollen
Der erste Schritt besteht darin zu bestimmen, welche Daten archiviert werden sollten. Als allgemeine Regel kann gelten, statische Daten, die seit einer Weile – vielleicht nach mehreren Monaten – nicht verändert worden sind, zu archivieren. Einige Unternehmen beginnen diesen Prozess, indem sie nach dem letzten Zugangsdatum zu den Daten schauen.
Aber es gibt eine Reihe von anderen Kategorien wie den Datentypen, die man für die eigene Archivierungsstrategie in Betracht ziehen muss. Zum Beispiel wird man sich für eine bestimmte Methode zur Archivierung von Dateidaten der Server entscheiden, aber für eine vollständig andere für unstrukturierte Daten bei einem SQL-Server.
Unglücklicherweise gibt es keine universelle Archivierungsmethode, die alle Datentypen in der gleichen Art und Weise behandelt. Dateidaten zu bewegen ist einfach, aber in der Regel klappt es nicht, eine komplette Datenbank-Tabelle zu archivieren, weil eine Anwendung wahrscheinlich die Tabelle benötigt. Stattdessen schließt die Archivierung einer Datenbank die Verschiebung alter Daten aus der Tabelle in ein Archiv einer Datenbank ein.
2. Den Einfluss des Data Lifecycle Managements auf den Archivierungsplan beachten
Eine andere bewährte Methode der Archivierung von Daten besteht in der Einschätzung des gesamten Data Lifecycle Managements des Unternehmens. Angenommen, man beschließt die Archivierung von Daten, die innerhalb von drei Jahren nicht verändert oder aufgerufen worden sind.
Diese Entscheidung führt zu einer Anzahl anderer Fragen im Zusammenhang mit dem Datenmanagement. Zum Beispiel stellt sich die Frage, ob alle Daten, die unter das Drei-Jahre-Kriterium fallen, archiviert werden sollten, oder ob man einige Arten von Daten nicht einfach löschen statt archivieren sollte. Genauso muss man entscheiden, ob die Daten für immer im Archiv bleiben sollen oder ob man sie nicht nach einiger Zeit bereinigen sollte.
Man sollte über genaue Kriterien verfügen, die die genauen Umstände festlegen, unter denen Daten archiviert werden. Auch sollten Anwender einen Plan dafür aufstellen, was letzten Endes mit den archivierten Daten geschehen soll. Viele Unternehmen gehen davon aus, dass Regeln für Datenarchivierung identisch mit einem Plan für ihre baldige Löschung sind. Sie werden irgendwann bereuen, dass sie keine genauen Kriterien für Löschen und Archivierung festgelegt haben.
Darüber hinaus ist es wichtig zu erkennen, dass Backup und Archivierung keineswegs die gleichen Datenschutz-Prozesse darstellen. Während sie über ähnliche Eigenschaften verfügen, steht Backup in der Regel für Daten bereit, zu denen ein Unternehmen einen schnellen Zugang benötigt, und Archivierung bedeutet, dass die Daten kaum noch angefasst werden.

3. Auf gesetzliche Vorgaben achten
Die Übereinstimmung mit gesetzlichen Regelungen ist ebenso ein kritisches Element. Nicht jedes Unternehmen unterliegt solchen Regelungen im Zusammenhang mit seinen Aufbewahrungsmaßnahmen, aber solche, die sie einhalten müssen, müssen mit schweren Strafen rechnen, wenn ihnen dabei Fehler unterlaufen. Multinationale Unternehmen müssen auf unterschiedliche Regelungen achten.
Außerdem muss die Archivierungspolitik des Unternehmens neuere Regelungen im Auge behalten. Um zum Beispiel der Datenschutz-Grundverordnung der EU zu entsprechen, muss man sich über die Vorgaben für das Speichern von Daten informieren, insofern sie die Archivierung betreffen.
Weil IT-Administratoren sowohl unter zivil- als auch strafrechtliche Vorschriften fallen können, wenn ihnen Fehler bei der Archivierung unterlaufen, archivieren einige von ihnen viel mehr Daten, als eigentlich vom Gesetz verlangt wird und behalten diese Archive dann für immer.
Das Problem mit diesem Ansatz besteht darin, dass er manchmal mehr Ärger als Freude bereitet. Gesamtstaatliche Regulierungen erfordern die Aufbewahrung bestimmter Daten, die dann bei Rechtsstreitigkeiten mit einem Unternehmen herangezogen werden können.
Viele Rechtsexperten, die Unternehmen in solchen Fällen vertreten, berichten davon, dass die Aufbewahrung von Daten über die staatlichen Vorgaben hinaus zu Problemen führen kann. Für Neulinge auf diesem Gebiet bedeutet es oft höhere Kosten, mehr Daten durchforsten zu müssen. Außerdem können mehr Daten ein größeres Schadenspotenzial verursachen.
4. Etablieren eigener Archivierungskriterien
Es gibt eine Reihe von verfügbaren Produkten für Datenarchivierung, die von Backup-Anwendungen mit eingebauten Archivierungsfunktionen bis zu voll ausgestatteten, dedizierten Managementanwendungen für archivierte Daten reichen. Egal welches Produkt man auswählt – es gibt verschiedene hauptsächliche Kriterien zu beachten.
Suche ist die erste wesentliche Fähigkeit. Der E-Discovery-Prozess beruht in der Regel auf der Prüfung großer Mengen an archivierten Daten. Eine effiziente Suchmaschine spart Zeit. Die Suchfunktion der Software sollte flexibel genug sein, um detaillierte Suchprozesse auf der Basis dieser Kriterien durchzuführen:
- Datentyp
- Datenquelle
- Autor des Dokuments
- Schlüsselbegriffe der Daten
- Daten, die eher mit einer bestimmten Datenstruktur als mit einem einzelnen Faktum übereinstimmen, wie zum Beispiel alle Daten, die eine Sozialversicherungsnummer enthalten (anstatt nach nur einer einzelnen Sozialversicherungsnummer zu suchen)
Die Rückverfolgung von Daten ist ein wichtiges Feature. Für eventuelle anhaltende Streitfälle und e-Discovery kann eine Kontrolle nachweisen, welcher Mitarbeiter Zugang zu den Archiven hatte, wann das geschah und welche bestimmten Daten geöffnet wurden.
Man sollte sich für ein Produkt der Datenarchivierung entscheiden, das so viele Datenplattformen wie nur möglich unterstützt. Während es kein universelles Archivierungsprodukt gibt, finden sich Archivierungsprodukte auf dem Markt, die für die Arbeit mit einer Reihe von populären Anwendungen und Plattformen entwickelt wurden. Einige von diesen besitzen sogar die Fähigkeit, Daten aus dem Internet wie zum Beispiel die Inhalte einer Facebook-Seite eines Unternehmens zu archivieren.
Ein wesentliches Feature stellt Data Deduplication dar. Archive können ihrer Natur nach bis zu einem großen Umfang anwachsen. Glücklicherweise unterstützt jedes moderne Archivierungsprodukt Deduplizierung.
Archivierungsprodukte sollten flexibel genug in Sachen Datenquellen und Datenziele sein. Nur weil ein Unternehmen heute Archive auf Tapes speichert, gilt das nicht auch für die nahe Zukunft. Ein gutes Archivierungsprodukt sollte das Schreiben von Archiven auf Festplatte, Tape, in die Cloud oder auf jedes andere Medium unterstützen.
In ähnlicher Weise sollten unterschiedliche Medien für die Wiederherstellung von Archiven unterstützt werden. Wenn Daten aus den Archiven herausgelöst werden, sollte man sie auf Tape oder jedes andere Medium schreiben können.
Schließlich sollte die Archivierungssoftware Automatisierungsfunktionen zur Verfügung stellen. Man wird nicht unbedingt wollen, dass Daten per Hand in Archive oder aus ihnen heraus bewegt werden. Ein gutes Archivierungsprodukt sollte sich leicht in die Archivierungsstrategie eines Unternehmens einfügen lassen.
Der Automatisierungsprozess sorgt dafür, dass Daten immer entsprechend dieser Strategie archiviert werden und dass nichts verloren geht. Die Software sollte auch für detaillierte Log-Daten des Archivierungsprozesses sorgen.
5. Entwickeln einer eigenen Archivierungspolitik
Sobald man sich darüber im Klaren ist, welche Daten man archivieren will, besteht der nächste Schritt darin, die eigene Archivierungspolitik festzulegen. Dieser Schritt umfasst einen formalisierten Satz von Operationen, die die Regeln für den Archivierungsprozess vorgeben. Zu der Archivierungspolitik sollten Komponenten wie diese gehören:
- Die Kriterien für die Archivierung von Daten
- die Mechanismen, die den Archivierungsprozess vereinfachen
- der Medientyp, der für das Speichern der archivierten Daten verwendet wird
- die Dauer, mit der die Daten im Archiv verbleiben
- die Regeln darüber, wer Zugang zu den Archiven erhält und unter welchen Bedingungen
Eine andere wichtige Überlegung der Archivierungspolitik betrifft den Schutz der Integrität des Archivs. Dieses Konzept betrifft zwei unterschiedliche Aspekte. Erstens müssen die Archive vor Eingriffen von außen geschützt werden. Sie müssen sicher genug sein, so dass kein Endanwender Änderungen an den archivierten Daten in einer unethischen Art und Weise vornehmen kann.
Der andere Aspekt des Datenschutzes betrifft den Schutz der archivierten Daten vor Verlust. Zum Beispiel könnte es passieren, dass ein Unternehmen seine ganzen Daten aus dem Jahr 2015 in ein Tape-Archiv verschoben hat und dass dieses Tape später de-magnetisiert wird und alle Daten aus diesem Jahr verloren gehen.
Um seine Archive gegen Datenverlust zu schützen, muss man mehrere Kopien von ihnen besitzen. Hier helfen Schnittstellen zu Cloud Storage. Eine Gateway-Appliance ist in der Lage, eine On-Premises-Kopie der Archive zu speichern, während sie auch Archive in die Cloud replizieren kann.
Wenn es sich um die Sicherung archivierter Daten handelt, hängt die Lösung davon ab, welches Zugangsniveau die Anwender brauchen. Auf der einfachsten Stufe müssen die archivierten Daten im Speichersystem verschlüsselt werden, und die Daten müssen als read-only gekennzeichnet sein, um unerlaubte Eingriffe zu verhindern.
Viele Unternehmen speichern archivierte Daten auf einem Storage-Server oder in der Cloud, getrennt vom Rest des produktiven Netzwerks. Diese Isolierung stellt einen weiteren Grad an Sicherheit zur Verfügung.
Egal auf welche Weise man seine Archive speichert, ein Überprüfungsmechanismus sollte sie zusätzlich schützen. Diese Kontrolle wird einen jederzeit alarmieren, sobald sich jemand einen Zugang zu den Archiven verschafft oder es versucht. Wenn die Funktionstüchtigkeit der Archive jemals in Frage gestellt ist, können die Audit-Logs bei der Untersuchung helfen, ob die archivierten Daten authentisch und nicht geändert worden sind.
Während das ursprüngliche Konzept der Archivierung selten genutzter Daten einfach ist, kann die praktische Umsetzung zu einer größeren Aktion werden. Wenn man eine klare und gut dokumentierte Archivierungsstrategie für die Daten besitzt, kann dieser Prozess wesentlich problemloser werden.