Definition

Data Lifecycle Management (DLM)

Was ist Data Lifecycle Management (DLM)?

Data Lifecycle Management (DLM), zu deutsch Datenlebenszyklusmanagement, ist ein richtlinienbasierter Ansatz zur Verwaltung des Datenflusses eines Informationssystems während seines gesamten Lebenszyklus: von der Erstellung und ersten Speicherung bis zu dem Zeitpunkt, an dem die Daten veraltet sind und gelöscht werden. Ziel ist es, die Sicherheit, Integrität, Qualität, Verfügbarkeit und Kostenoptimierung von Daten zu gewährleisten.

DLM-Produkte automatisieren Lebenszyklusmanagementprozesse. In der Regel organisieren sie Daten gemäß festgelegten Richtlinien in separate Ebenen (Tiers) und automatisieren die Datenmigration zwischen diesen Ebenen. Neuere Daten oder Daten, auf die häufiger zugegriffen wird, werden auf schnelleren und teureren Speichermedien gespeichert, während weniger wichtige oder selten genutzte Daten auf günstigeren, langsameren Medien abgelegt werden. Fortschrittliche DLM-Lösungen nutzen zunehmend Cloud-Storage, Hybrid-Cloud- oder Multi-Cloud-Szenarien und unterstützen Automatisierung, KI-gestützte Klassifizierung und Data-Lineage-Funktionen.

Hauptziele des Datenlebenszyklusmanagements

Unternehmen verarbeiten mehr Daten als je zuvor, die vor Ort, in Colocation-Einrichtungen, auf Edge-Geräten, in Cloud-Plattformen oder in beliebigen Kombinationen dieser Speicherstandorte gespeichert sein können. Der Bedarf an einer effektiven DLM-Strategie ist größer denn je, und diese muss umfassend sein.

Abbildung 1: Das Datenlebenszyklusmanagement automatisiert die Prozesse des Lebenszyklusmanagements.
Abbildung 1: Das Datenlebenszyklusmanagement automatisiert die Prozesse des Lebenszyklusmanagements.

Viele Quellen nennen die folgenden drei Ziele als zentral für eine erfolgreiche DLM-Strategie:

  • Datensicherheit und Vertraulichkeit. Daten müssen jederzeit geschützt werden, um private, vertrauliche und sensible Informationen vor Gefährdungen zu bewahren. Dies schließt Aspekte wie Verschlüsselung, Zugriffskontrollen, Auditierung und Einhaltung gesetzlicher Vorschriften ein (zum Beispiel DSGVO, NIS2, HIPAA, CCPA).
  • Datenintegrität und Datenqualität. Daten müssen korrekt, zuverlässig und konsistent sein, unabhängig davon, wo sie gespeichert sind oder wie viele Kopien existieren. Dies umfasst Validierung, Bereinigung, Standardisierung und Monitoring von Datenqualität.
  • Datenverfügbarkeit. Zugelassene Benutzer sollten jederzeit und überall auf die benötigten Daten zugreifen können, ohne dass Arbeitsabläufe unterbrochen werden. Dies betrifft sowohl aktive Daten als auch archivierte Daten, die möglicherweise reaktiviert werden müssen.

Compliance, Datenschutz und regulatorische Anforderungen gewinnen weiterhin an Bedeutung, insbesondere in global verteilten IT-Landschaften.

Abbildung 2: Die EU-DSGVO gibt klare Definitionen, was persönliche Daten sind.
Abbildung 2: Die EU-DSGVO gibt klare Definitionen, was persönliche Daten sind.

Hauptphasen des Data Lifecycle Managements

DLM lässt sich in mehrere Phasen unterteilen, die einen Rahmen für die Arbeit mit Daten während ihres gesamten Lebenszyklus bilden. Obwohl Ressourcen die Phasen unterschiedlich benennen, folgt ein übliches Modell:

1. Daten generieren und sammeln. Strukturierte und unstrukturierte Daten werden kontinuierlich von Benutzern, Geräten, Anwendungen, Maschinen, IoT-Geräten und anderen Quellen erstellt. Die Erfassung kann selektiv erfolgen – beispielsweise nur anomale Sensordaten werden gesammelt.

2. Daten verarbeiten, speichern und verwalten. Daten werden aufbereitet (bereinigt, transformiert, verschlüsselt, klassifiziert), stabil gespeichert und gepflegt. Dazu gehört auch die Implementierung von Redundanz, Disaster Recovery, Metadatenverwaltung und Data-Lineage-Tracking. Cloud- und Hybrid-Storage-Architekturen werden zunehmend genutzt, um Kosten und Performance zu optimieren.

3. Daten verwenden und teilen. Daten werden für tägliche Aufgaben, Analysen, Business Intelligence, Visualisierung oder maschinelles Lernen genutzt. Diese Phase erzeugt oft neue Daten, die wiederum gespeichert und verarbeitet werden müssen.

Abbildung 3: Augmented Data Lifecycle Management nutzt maschinelles Lernen und KI, um eine selbstkonfigurierende und selbststeuernde Datenverwaltung zu ermöglichen.
Abbildung 3: Augmented Data Lifecycle Management nutzt maschinelles Lernen und KI, um eine selbstkonfigurierende und selbststeuernde Datenverwaltung zu ermöglichen.

4. Daten archivieren. Nicht mehr aktiv genutzte Daten werden in sicheren Langzeitspeichern (zum Beispiel Bandspeicher, Cloud-Cold-Storage) abgelegt. Archivierte Daten bleiben verfügbar für Compliance, Analyse, Berichte oder Audits. Auch hier sind Sicherheit, Integrität und Zugriffskontrollen relevant.

5. Daten vernichten oder anonymisieren. Am Ende ihres Lebenszyklus werden Daten sicher gelöscht oder anonymisiert, unter Einhaltung der geltenden Datenschutzgesetze (zum Beispiel DSGVO). Der Unterschied zwischen vollständiger Löschung und Anonymisierung ist besonders wichtig, wenn Daten für statistische Zwecke oder Analysen weiterverwendet werden sollen.

Diese Phasen sind nicht streng linear. Daten werden häufig gleichzeitig generiert, verarbeitet, genutzt und archiviert, und Analysen können neue Daten erzeugen, die in den Zyklus zurückfließen.

DLM im Vergleich zu HSM und ILM

Hierarchisches Speichermanagement (HSM) ist eine spezifische Form von DLM. HSM organisiert Daten auf verschiedenen Speicherebenen (SSDs, HDDs, optische Medien, Band) mit unterschiedlichen Kosten und Leistungsklassen. Richtlinien steuern, wann Daten migriert werden.

Abbildung 4: Das Datenlebenszyklusmanagement automatisiert die Organisation von Daten in separate Ebenen gemäß festgelegten Richtlinien.
Abbildung 4: Das Datenlebenszyklusmanagement automatisiert die Organisation von Daten in separate Ebenen gemäß festgelegten Richtlinien.

Information Lifecycle Management (ILM) geht über DLM hinaus:

  • DLM-Produkte arbeiten meist mit allgemeinen Dateiattributen (Typ, Größe, Alter).
  • ILM-Produkte ermöglichen die Suche nach inhaltsspezifischen Daten (beispielsweise Kundennummern, personenbezogene Informationen), wichtig für Compliance wie das Recht auf Vergessenwerden nach DSGVO.

Viele effiziente DLM/ILM-Systeme kombinieren Funktionen wie Klassifizierung, Automatisierung, Metadaten-Management, Audit-Trails und Richtliniensteuerung, um die gesamte Dateninfrastruktur effizient und regelkonform zu verwalten.

Das Wichtigste auf einen Blick: Data Lifecycle Management (DLM)

Data Lifecycle Management oder Datenlebenszyklusmanagement (DLM) steuert Daten von der Generierung über Nutzung, Speicherung und Archivierung bis zur sicheren Löschung. Es gewährleistet Datensicherheit, Integrität, Qualität, Verfügbarkeit und Compliance, optimiert Speicherressourcen und Kosten, unterstützt Automatisierung und Cloud-Nutzung und schafft Transparenz durch Metadaten, Klassifikation und Data Lineage. Moderne DLM-Lösungen helfen Unternehmen, Daten effizient zu verwalten und gesetzliche Anforderungen wie DSGVO, NIS2 oder HIPAA einzuhalten.

Erfahren Sie mehr über Storage Management