Definition

Datenreduktion

Unter Datenreduktion versteht man den Prozess des Minimierens der Datenmenge, die in einer Storage-Umgebung gespeichert werden muss. Die Datenreduktion kann die Storage-Effizienz erhöhen und so zur Kostensenkung beitragen.

Sie kann durch Verwendung einer Reihe unterschiedlicher Technologien erreicht werden. Die bekannteste – die sogenannte Deduplizierung – eliminiert redundante Daten auf den Storage-Systemen.

Daten-Deduplizierung erfolgt auf Block-Ebene. Das System analysiert das Storage, um redundante Blocks zu identifizieren und diese dann zu entfernen. Der verbleibende Block wird von allen Files oder Anwendern geteilt, die davon eine Kopie benötigen. Das wird mit so genannten Pointern realisiert, die die jeweilige Anwendung an die eindeutigen Daten beziehungsweise Blöcke verweist. Versucht eine Anwendung Änderungen vorzunehmen, so kopiert das System den Block vorher, sodass andere Anwendungen diesen nach wie vor in der unveränderten Version nutzen können. Dadurch wird Datenkorruption vermieden.

Einige Storage-Arrays verfolgen Blöcke, die am häufigsten geteilt werden. Diese werden dann in einen Memory- oder Flash-basierten Cache transferiert, damit sie so effizient wie möglich gelesen werden können.

Neben der Deduplizierung und ihren verschiedenen Formen gibt es noch die Methoden der Komprimierung und der Archivierung, die ebenfalls die Datenbestände des Primärspeichers reduzieren können. Komprimierung verringert den benötigten Storage-Platz durch das Entfernen redundanter Informationen innerhalb von Files. Das wird erreicht durch den Einsatz von Algorithmen und Formeln, die doppelte Daten-Bits erkennen.

Die Archivierung verfolgt einen anderen Ansatz, verringert aber auch den verwendeten Speicherplatz im primären Speicher. Hierbei werden keine kleinen Datenstücke oder Blöcke entfernt, sondern ältere und nicht mehr häufig gelesene Datenbestände auf günstigeren Storage transportiert. Dabei kann es sich um Festplatten-Arrays, Bänder oder Cloud-Dienste handeln.

Deduplizierung und Komprimierung wird mittlerweile auch zu einem gängigen Verfahren für Flash-Speicher. Da dieser relativ teuer ist, können Datenreduktionsmethoden helfen, das Meiste aus der Flash-Kapazität herauszuholen. Da Flash hohe Performance bietet, fällt zudem der Overhead für das Reduktionsverfahren nicht ins Gewicht und beeinflusst das System nicht.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Diese Definition wurde zuletzt im Mai 2016 aktualisiert

Erfahren Sie mehr über Storage Management

ComputerWeekly.de
Close