Definition

Datenarchivierung (Archivierung)

Bei der Datenarchivierung werden Daten, die nicht mehr aktiv genutzt werden, zur langfristigen Aufbewahrung auf ein separates Speichergerät verschoben. Archivdaten bestehen aus älteren Daten, die für das Unternehmen weiterhin wichtig sind oder aus Gründen der zukünftigen Referenz oder der Einhaltung gesetzlicher Vorschriften aufbewahrt werden müssen. Datenarchive sind indexiert und verfügen über Suchfunktionen, so dass Dateien gefunden und abgerufen werden können.

Archivierte Daten werden auf einer kostengünstigeren Speicherebene gespeichert, wodurch der Primärspeicherverbrauch und die damit verbundenen Kosten gesenkt werden können. Ein wichtiger Aspekt der Datenarchivierungsstrategie eines Unternehmens besteht darin, seine Daten zu inventarisieren und zu ermitteln, welche Daten für die Archivierung in Frage kommen.

Einige Archivsysteme behandeln Archivdaten als schreibgeschützt, um sie vor Änderungen oder Manipulation zu schützen, während andere Datenarchivierungsprodukte sowohl Schreib- als auch Lesevorgänge ermöglichen. Zum Beispiel verwendet die WORM-Technologie (Write Once Read Many) Medien, die nicht wiederbeschreibbar sind.

Die Datenarchivierung eignet sich am besten für Daten, die aufgrund betrieblicher oder gesetzlicher Anforderungen aufbewahrt werden müssen, zum Beispiel Dokumentdateien, E-Mail-Nachrichten und möglicherweise alte Datenbankeinträge.

Vorteile der Datenarchivierung

Der größte Vorteil der Datenarchivierung ist die Reduzierung der Kosten für die Speicherung auf teurem primären oder Tier-1-Speicher. Primärspeicher ist in der Regel teuer, da ein Speicherarray ein ausreichendes Niveau an IOPS erzeugen muss, um die betrieblichen Anforderungen an die Lese-/Schreibaktivität der Benutzer zu erfüllen. Im Gegensatz dazu ist der Archivspeicher kostengünstiger, da er in der Regel auf einem Speichermedium mit geringer Leistung und hoher Kapazität basiert. Datenarchive können auf kostengünstigen Festplattenlaufwerken (HDDs), Bändern oder optischen Medien gespeichert werden, die im Allgemeinen langsamer sind als Hochleistungsplatten- oder Flash-Laufwerke.

Die Archivspeicherung reduziert auch das Volumen der Daten, die gesichert werden müssen. Das Entfernen von Daten, auf die nur selten zugegriffen wird, aus dem Backup-Datensatz verbessert die Backup- und Wiederherstellungsleistung. Üblicherweise wird die Datendeduplizierung bei der Verschiebung von Daten auf eine niedrigere Speicherebene durchgeführt, wodurch der Gesamtspeicherbedarf reduziert und die Kosten für Sekundärspeicher gesenkt werden.

Datenarchivierung vs. Backup

Datenarchive sind nicht zu verwechseln mit Datensicherungen (Backups), die Kopien von Daten sind. Obwohl beide als Sekundärspeicher betrachtet werden und ein Speichermedium mit geringerer Leistung und höherer Kapazität als der Primärspeicher verwenden, dienen sie unterschiedlichen Zwecken. Archive erfüllen einen Datenaufbewahrungszweck, während Backups für die Datensicherung und das Disaster Recovery verwendet werden.

Datenarchive kann man sich als Datenspeicher für selten abgerufene, aber dennoch leicht verfügbare Daten vorstellen. Backups hingegen sind Teil eines Datenwiederherstellungsmechanismus, mit dem Daten wiederhergestellt werden können, falls sie beschädigt oder zerstört werden. Backup-Daten bestehen oft aus wichtigen Informationen, die bei Verlust oder Löschung schnell wiederhergestellt werden müssen.

Online- vs. Offline-Datenspeicherung

Datenarchive treten in unterschiedlichen Formen auf. Einige Systeme nutzen die Online-Datenspeicherung, bei der die Archivdaten auf Plattensystemen abgelegt werden, wo sie leicht zugänglich sind. Archive sind häufig dateibasiert, aber die Objektspeicherung erfreut sich wachsender Beliebtheit.

Abbildung 1: Zur Datenarchivierung kann unter anderem die Quantum Scalar i3-Bandbibliothek verwendet werden.
Abbildung 1: Zur Datenarchivierung kann unter anderem die Quantum Scalar i3-Bandbibliothek verwendet werden.

Andere Archivsysteme verwenden Offline-Datenspeicherung, bei der die Archivdaten mit Hilfe von Datenarchivierungssoftware auf Band oder andere Wechseldatenträger geschrieben werden, anstatt online gehalten zu werden. Da Bänder entfernt werden können, verbrauchen bandbasierte Archive weitaus weniger Strom als Plattensysteme. Dies führt zu niedrigeren Archivspeicherkosten.

Cloud Storage ist ein weiteres mögliches Archivierungsziel. Amazon Glacier, zum Beispiel, ist für die Datenarchivierung konzipiert. Diese Methode ist kostengünstig, erfordert jedoch eine laufende Investition. Darüber hinaus können die Kosten im Laufe der Zeit steigen, wenn mehr Daten in die Speicher-Cloud aufgenommen werden. Cloud-Anbieter speichern archivierte Daten normalerweise auf Band oder langsameren Festplatten mit hoher Kapazität.

Datenarchivierung und Data Lifecycle Management

Der Archivierungsprozess wird fast immer mit Hilfe von Archivierungssoftware automatisiert. Die Fähigkeiten einer solchen Software sind von Anbieter zu Anbieter unterschiedlich, aber die meisten Archivierungsprogramme verschieben alternde Daten automatisch in die Archive, gemäß einer vom Speicheradministrator festgelegten Datenarchivierungsrichtlinie. Diese Richtlinie kann auch spezifische Aufbewahrungsanforderungen für jeden Datentyp enthalten.

Einige Archivierungssoftware löscht Daten automatisch aus den Archiven, sobald sie die von der Datenaufbewahrungsrichtlinie der Organisation vorgeschriebene Lebensdauer überschritten haben. Viele Backup-Software- und Datenverwaltungsplattformen haben ihren Produkten Archivierungsfunktionalität hinzugefügt. Je nach Ihren Bedürfnissen kann dies ein kostengünstiger und effizienter Weg sein, Daten zu archivieren. Allerdings enthalten diese Produkte möglicherweise nicht alle Funktionen, die in einem speziellen Archivsoftwareprodukt enthalten sind.

Compliance

Einige Unternehmen sind aufgrund der Einhaltung gesetzlicher Vorschriften verpflichtet, Daten für eine bestimmte Zeit aufzubewahren. Unabhängig davon, ob die Einhaltung von Branchenvorschriften oder staatlichen Gesetzen vorgeschrieben ist, ist die Einhaltung von Compliance-Richtlinien ein weit verbreitetes Geschäftsanliegen. Strafen für die Nichteinhaltung können Schadenersatzzahlungen, Bußgelder und nichtige Verträge umfassen.

Die Datenarchivierung hilft Unternehmen bei der Einhaltung von Vorschriften, indem Daten langfristig gespeichert und für den einfachen Zugriff im Falle einer Prüfung konsolidiert werden. Die Regeln, die vorschreiben, wie lange Daten aufbewahrt werden müssen, wo sie gespeichert werden können und wer Zugriff auf sie hat, variieren je nach Branche und der Art der Daten, die Unternehmen in dieser Branche erzeugen.

Einige Beispiele für Vorschriften, an die sich Unternehmen halten müssen, sind der Sarbanes-Oxley Act (SOX), der Health Insurance Portability and Accountability Act (HIPAA) und die General Data Protection Regulation (GDPR, DSGVO).

Diese Definition wurde zuletzt im Dezember 2020 aktualisiert

Erfahren Sie mehr über Backup-Lösungen und Tools

ComputerWeekly.de
Close