Sergey Nivens - Fotolia

Im Vergleich: Komprimierung, Deduplizierung, Verschlüsselung

Der Artikel erklärt die Unterschiede und Gemeinsamkeiten zwischen Datenkompression, Dedupe und Verschlüsselung, da diese Datenschutzmethoden für Speicher immer wichtiger werden.

Da immer mehr Unternehmensdaten auf die rotierende Festplatten verlagert werden, müssen Speicher-Administratoren diese wachsende Kapazität implementieren, konfigurieren und verwalten, indem sie den Festplattenspeicher bis zum Äußersten erweitern und gleichzeitig wichtige Daten vor Verlust oder Diebstahl schützen.

Komprimierung, Deduplizierung und Verschlüsselung sind gängige Data-Protection-Technologien für die Verwaltung und Optimierung von Festplattenspeicher, und es ist wichtig zu verstehen, welche Rolle jeder einzelne im Rechenzentrum spielt.

Datenkompression oder Komprimierung

Die Komprimierung versucht, die Größe einer Datei zu reduzieren, indem redundante Daten innerhalb der Datei entfernt werden. Durch die Verkleinerung von Dateien wird weniger Festplattenspeicher verbraucht, und es können mehr Dateien auf der Festplatte gespeichert werden. So kann beispielsweise eine 100 KByte große Textdatei auf 52 KByte komprimiert werden, indem zusätzliche Leerzeichen entfernt oder lange Zeichenketten durch kurze Darstellungen ersetzt werden. Ein Algorithmus stellt die Originaldaten beim Lesen der Datei wieder her. Bilddateien werden in der Regel ebenfalls komprimiert. So verwendet beispielsweise das JPEG-Bilddateiformat die Kompression, um redundante Pixeldaten zu eliminieren.

Fast jede Datei lässt sich komprimieren, obwohl Dateien mit nicht redundanten Daten wenig oder gar keine Kompression aufweisen, so dass Kompressionsraten eine Richtlinie und keine Regel sind. Ein 2:1-Komprimierungsverhältnis kann beispielsweise im Idealfall Dateien im Wert von 400 GByte auf einer 200 GByte Festplatte zulassen. Es ist schwierig, genau zu bestimmen, wie weit eine Datei komprimiert werden kann, bis ein Kompressionsalgorithmus angewendet wird.

Datendeduplizierung

Ein typisches Rechenzentrum kann mehrere Kopien derselben Datei speichern. Die Datendeduplizierung – manchmal auch Datenreduktion oder Einzelinstanzspeicherung genannt – ist eine weitere platzsparende Data-Protection-Technologie, die darauf abzielt, redundante Dateien auf einem Speichersystem zu eliminieren. Durch das Speichern nur einer Instanz einer Datei kann der Festplattenspeicher erheblich reduziert werden.

Angenommen, die gleiche 10-MByte-PowerPoint-Präsentation wird in zehn Ordnern für jeden Vertriebsmitarbeiter oder jede Abteilung gespeichert. Das sind 100 MByte Festplattenspeicher, die benötigt werden, um die gleiche 10 MByte große Datei zu verwalten. Die Datendeduplizierung stellt sicher, dass nur eine vollständige Kopie auf der Festplatte gespeichert wird. Spätere Iterationen der Datei werden nur als Verweise gespeichert, die auf die gespeicherte Kopie verweisen, so dass die Benutzer ihre eigenen Dateien weiterhin sehen können. Ebenso kann ein Speichersystem 200 E-Mails mit jeweils einem MByte Anhang speichern. Mit der Deduplizierung werden die 200 MByte, die für die Speicherung jedes 1-MByte-Anhangs benötigt werden, auf nur ein MByte für eine Iteration der Datei reduziert.

Die Deduplizierung auf Blockebene speichert eindeutige Wiederholungen jedes Blocks in einer Datei. Wenn ein Benutzer eine Datei aktualisiert, werden nur die überarbeiteten Daten gespeichert. Da die Änderungen keine völlig neue Datei begründen, ist die Block-Level-Deduplizierung effizienter als die Deduplizierung auf Dateiebene. Die Deduplizierung auf Blockebene erfordert jedoch mehr Rechenleistung und verwendet einen größeren Index, um einzelne Teile zu verfolgen.

Die Deduplizierung kann auch eine detailliertere Kontrolle bieten, indem sie redundante Teile von Dateien entfernt, möglicherweise bis auf Blockebene. Bei der Bewertung eines Deduplizierungsprodukts ist es wichtig, die Granularität zu verstehen, die die Plattform des Herstellers bietet.

Anbieter geben häufig ihre Deduplizierungsrate preis. Ein Deduplizierungsverhältnis von 10:1 bedeutet beispielsweise, dass zehnmal mehr Daten geschützt sind als der physische Speicherplatz, der für ihre Speicherung benötigt wird.

Verschlüsselung

Angesichts der zunehmenden staatlichen Vorschriften und Rechtsstreitigkeiten müssen Datenspeicherverwalter der Rolle der Sicherheit bei der Speicherung in Unternehmen besondere Aufmerksamkeit schenken. Die Verschlüsselung ist eine wichtige Data-Protection-Technologie, die verhindert, dass unbefugte Benutzer auf Informationen zugreifen können, selbst wenn Dateien gehackt und gestohlen werden.

Die Verschlüsselung verwendet einen mathematischen Algorithmus mit einem eindeutigen Schlüssel, um eine Datei in eine Form zu kodieren, die nicht gelesen werden kann. Niemand sonst kann auf die verschlüsselte Datei zugreifen oder sie verwenden, bis sie mit dem gleichen Schlüssel entschlüsselt wird. Wenn der Schlüssel verloren geht, sind alle mit diesem Schlüssel verschlüsselten Daten nicht mehr zugänglich.

Die Verschlüsselung ist ein Kernelement von Data-Protection-Produkten. Wenn Sie Daten von einem Standort zum anderen verschieben, ist es am besten, sie am ursprünglichen Standort zu verschlüsseln, während sie transferiert werden und wenn sie am neuen Standort abgelegt wurden. Es ist wichtig, Backups mit einem guten Algorithmus und einer soliden Schlüsselverwaltung richtig zu verschlüsseln.

Die End-to-End-Verschlüsselung verhindert, dass Daten, die zwischen zwei Standorten gesendet werden, von jedem eingesehen werden können, der den Kommunikationskanal abfängt. Textnachrichtenanwendungen wie Apple iMessage verwenden oft eine End-to-End-Verschlüsselung, aber die Strafverfolgungsbehörden haben die Anbieter kritisiert, weil die Technologie sie am Zugriff auf Informationen hindert.

Wie die Technologien zusammenarbeiten

Zusammengenommen ermöglichen die drei Technologien eine höhere Kapazität und einen besseren Schutz. Eine speziell entwickelte Backup-Appliance enthält beispielsweise Deduplizierung, Komprimierung und Verschlüsselung mit dem Ziel, Daten vor Angriffen zu schützen und redundante Daten zu entfernen.

Zusammen-genommen ermöglichen die drei Technologien eine höhere Kapazität und einen besseren Schutz.

Deduplizierung ist oft mit Kompression verbunden, und viele Speichersysteme unterstützen beide Technologien, weil sie die Speicherkapazität optimieren und längere Aufbewahrungsfristen, einen geringeren Bandbreitenverbrauch und schnellere Wiederherstellungen ermöglichen. Ein Unternehmen kann beides zusammen verwenden, zum Beispiel indem es eine Speicherumgebung dedupliziert und dann die Dateien komprimiert.

Wie sich die Technologien unterscheiden

Die genannten Technologien sind ähnlich, funktionieren aber unterschiedlich. Die Deduplizierung sucht nach redundanten Daten, während die Kompression einen Algorithmus verwendet, um die für die Darstellung der Daten erforderlichen Bits zu reduzieren. Die Deduplizierung ist in Unternehmen mit vielen redundanten Daten effektiv, zum Beispiel bei Backup-Systemen, die mehrere Versionen derselben Datei haben. Die Komprimierung ist wirksam, um die Größe einzelner Dateien, wie Bilder, Videos und Datenbanken, zu verringern. Während die Deduplizierung typischerweise auf Blockebene funktioniert, funktioniert die Kompression eher auf Dateiebene.

Während Deduplizierung und Komprimierung auf den Speicher ausgerichtet sind, ist die Verschlüsselung eher ein Sicherheitsmerkmal.

Wo sich die drei Technologien überschneiden

Wenn ein Unternehmen alle drei Data-Protection-Technologien verwendet, sollte es Daten vor der Verschlüsselung deduplizieren und komprimieren. Verschlüsselte Dateien sind schwer zu deduplizieren und zu komprimieren, da man den Schlüssel benötigt, um die Dateien zuerst zu entsperren.

Komprimierung und Deduplizierung können sich negativ auf die Speicherleistung auswirken. Beide Technologien benötigen erhebliche Rechenressourcen und können die Latenzzeiten erhöhen. Eine Möglichkeit, herauszufinden, wie gut ein Speichersystem Kompression und Deduplizierung umsetzt, ist die Durchführung eines Tests.

Darüber hinaus sollten Unternehmen bei der Deduplizierung und Komprimierung auf Ausfallsicherheit achten. Da beide Datenschutzverfahren redundante Daten entfernen, kann eine Speicherumgebung mit einer vollständigen Kopie des Inhalts belassen werden, so dass eine ordnungsgemäße Sicherung ein wichtiges Element ist.

Wie Deduplizierung und Komprimierung mit anderen Technologien funktionieren

Deduplizierung und Komprimierung lassen sich oft mit anderen Technologien für einen verbesserten Schutz kombinieren. Deduplizierung und Replizierung unterstützen die Wiederherstellung im Katastrophenfall. In diesem Fall würde ein Unternehmen die Deduplizierung zuerst verwenden, um die Menge der doppelten Daten zu reduzieren und dann die Daten außerhalb des Unternehmens zu replizieren.

Erasure Coding kann mit Komprimierung und Deduplizierung arbeiten, um die Speicherkapazität zu erhalten. Erasure Coding rekonstruiert Daten, die beschädigt wurden.

RAID funktioniert auch mit Kompression und Deduplizierung. RAID speichert die gleichen Daten an verschiedenen Stellen, um sie im Falle eines Ausfalls zu schützen. 

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Wie Kompression und Dedupe die Performance beeinflussen

Einschränkungen der Komprimierung

Warum Verschlüsselung beim Backup wichtig ist

Erfahren Sie mehr über Datensicherheit

ComputerWeekly.de
Close