Vollständig, inkrementell oder differenziell: Wie Sie den richtigen Backup-Typ wählen

Ob Vollständig, inkrementell oder differenziell, jeder Backup-Typ hat jedoch seine Vor- und Nachteile. Die richtige Strategie ist entscheidend.

Der Schutz von Daten vor Verlust, Beschädigung, Katastrophen (natürliche oder vom Menschen verursachte) und anderen Problemen ist einer der wichtigsten Aufgaben für IT-Abteilungen. In der Theorie sind die Konzepte dafür ganz einfach, doch die Implementierung eines effizienten und effektiven Satzes an Backup-Operationen kann sehr schwierig sein.

Der Ausdruck Backup ist mittlerweile ein Synonym für Daten-Sicherung geworden. Erreichen lässt sie sich über mehrere Methoden. Um die Komplexität von Backup- und Recovery-Tätigkeiten zu reduzieren, wurden viele Software-Anwendungen entwickelt. Dabei sind Backups nur ein Teil eines umfassenden Planes für Schutz für den Katastrophen-Fall. Und ohne sorgfältige Auslegung und Tests reichen sie vielleicht nicht aus, um den erwünschten Umfang an Möglichkeiten zur Wiederherstellung von Daten und nach Katastrophen zu erreichen.

Zweck von Backups ist es zumeist, eine Kopie von Daten anzulegen, damit eine bestimmte Datei oder Anwendung wiederhergestellt werden kann, nachdem Daten verloren oder beschädigt wurden oder sich eine Katastrophe ereignet hat. Damit sind Backups nur ein Mittel zum Zweck, nämlich zur Sicherung von Daten. Backups zu testen, ist dabei ebenso wichtig wie das eigentliche Anlegen. Noch einmal: Backups sollen die Möglichkeit schaffen, Daten später wiederherzustellen. Ohne regelmäßige Tests lässt sich aber nicht garantieren, dass dies im Ernstfall auch gelingen wird.

Backups von Daten werden manchmal mit Archivierung verwechselt, obwohl sich beide Tätigkeiten unterscheiden. Ein Backup ist eine sekundäre Kopie von Daten zu Zwecken der Daten-Sicherung. Bei Archiven dagegen handelt es sich um primäre Daten, die für langfristige, kostengünstige Aufbewahrung auf weniger teure Medien verlagert werden (etwa Bänder).

Backup-Anwendungen bieten seit langem unterschiedliche Arten von Backups. Die häufigsten davon sind vollständige Backups, inkrementelle Backups und differenzielle Backups. Außerdem gibt es noch synthetische vollständige Backups, Mirroring, revers inkrementelle Backups und kontinuierliche Daten-Sicherung (CSP).

Vollständige Backups

Der grundlegendste und umfassendste Backup-Typ sind vollständige Backups. Wie der Name schon sagt, werden dabei sämtliche Daten auf andere Medien kopiert, zum Beispiel Bänder, Festplatten oder DVDs/CDs. Der Hauptvorteil von vollständigen Backups besteht darin, dass damit jeweils eine vollständige Kopie aller Daten auf einer einzigen Medien-Sammlung verfügbar ist. Dadurch lassen sich Daten schnell wiederherstellen, was in der Kennzahl Recovery Time Objective (RTO) festgehalten wird. Allerdings nehmen vollständige Backups deutlich mehr Zeit in Anspruch (bis zu zehnmal mehr) als andere Typen, und sie brauchen mehr Speicherplatz.

Aus diesem Grund werden vollständige Backups meist nur gelegentlich angelegt. Rechenzentren mit geringen Mengen an Daten (oder kritischen Anwendungen) machen vielleicht jeden Tag ein vollständiges Backup, manchmal sogar öfter. In den meisten Fällen aber werden vollständige Backups in Kombination mit inkrementellen oder differenziellen eingesetzt.

Inkrementelle Backups

Bei einem inkrementellen Backup werden nur die Daten gesichert, die sich seit dem letzten Backup – egal welchen Typs – verändert haben. Meistens wird dazu die Zeitangabe zur letzten Änderung einer Datei mit dem Datum des letzten Backups verglichen. Backup-Anwendungen erfassen Datum und Zeitpunkte sämtlicher Backup-Operationen und wissen auf diese Weise, welche Dateien zuletzt geändert wurden.

Weil bei inkrementellen Backups nur die seit dem letzten Backup geänderten Daten kopiert werden, können sie so oft laufen wie gewünscht – es werden ja nur die aktuellsten Änderungen berücksichtigt. Der Vorteil dabei ist, dass weniger Daten gespeichert werden müssen als bei vollständigen Backups. Damit sind derartige Operationen schneller beendet, und es wird weniger Storage-Platz dafür gebraucht.

Differenzielle Backups

Differenzielle Backups ähneln bei ihrem ersten Durchlauf inkrementellen: Alle seit dem letzten Backup veränderten Daten werden kopiert. Anschließend allerdings werden weiter alle Daten kopiert, die sich seit dem letzten vollständigen Backup geändert haben. Damit werden bei Folge-Durchläufen meist mehr Daten kopiert als bei inkrementellen Backups, aber immer noch deutlich weniger als bei vollständigen. Auch hinsichtlich Zeit- und Platz-Bedarf sind differenzielle Backups anspruchsvoller als inkrementelle, aber bescheidener als vollständige.

Tabelle 1: Vergleich von unterschiedlichen Backup-Typen

Typ/Backup Nr. vollständig inkrementell differenziell
Backup 1 alle Daten -- --
Backup 2 alle Daten Änderungen seit Backup 1 Änderungen seit Backup 1
Backup 3 alle Daten Änderungen seit Backup 2 Änderungen seit Backup 1
Backup 4 alle Daten Änderungen seit Backup 3 Änderungen seit Backup 1

Wie in Tabelle 1 zu sehen, funktioniert jeder Backup-Typ anders. Ein vollständiges Backup muss mindestens einmal angelegt werden, anschließend sind vollständige, inkrementelle oder differenzielle gleichermaßen möglich. Beim ersten anschließenden Teil-Backup gibt es keinen Unterschied zwischen inkrementell und differenziell. Beim dritten Durchlauf sind inkrementelle Backups auf Änderungen seit dem zweiten begrenzt; differenzielle Backups dagegen umfassen weiter alles, was seit dem ersten Backup geändert wurde.

Auf Grundlage dieser drei Haupttypen für Backups lässt sich eine Strategie für die Sicherung von Daten erarbeiten. Meistens wird dafür einer der folgenden Ansätze genutzt:

  • Täglich vollständig
  • Wöchentlich vollständig + täglich differenziell
  • Wöchentlich vollständig + täglich inkrementell

Welchen davon Sie wählen, hängt von vielen Faktoren ab. Meist gibt es dabei Zielkonflikte zwischen Performance, Grad der Daten-Sicherung, Gesamtvolumen an Daten und Kosten. In Tabelle 2 sind die für die drei typischen Backup-Strategien erforderlichen Speicher-Kapazitäten sowie die Medien für eine Wiederherstellung dargestellt. Bei den Berechnungen wird davon ausgegangen, dass es insgesamt 20 Terabyte an Daten gibt, von denen sich täglich fünf Prozent ändern; das Gesamtvolumen nimmt im Lauf der Zeit nicht zu. Weitere Annahmen sind 22 Arbeitstage pro Monat und ein Monat Aufbewahrungszeit für Daten.

Tabelle 2: Backup-Strategien und Platz-Bedarf

Backup-Strategie

Erforderlicher Platz für einen Monat

(20 TB, 5 % tägliche Änderung)

Medien für Wiederherstellung

täglich vollständig

(wochentags)

22 Voll-Backups  x 20 TB = 440 TB

nur aktuellstes Backup

 

wöchentlich voll,

täglich differenziell

5 x Voll + aktuellstes differenzielles

5 x 20 TB + 22 x 5% x 20 TB = 124,3 TB

aktuellstes vollständiges +

aktuellstes differenzielles

wöchentlich voll,

täglich inkrementell

5 x Voll + alle inkrementellen seitdem

5 x 20 TB + 22 x 5% x 20 TB = 122 TB

aktuellstes vollständiges +

alle inkrementellen seitdem

Wie die Tabelle zeigt, erfordern täglich vollständige Backups am meisten Speicherplatz; auch der Zeitaufwand ist bei ihnen am größten. Allerdings liegen damit die Daten vollständiger vor, und es werden nicht unterschiedliche Medien benötigt, um eine Wiederherstellung vorzunehmen. Damit ist diese Backup-Strategie weniger anfällig für Katastrophen und bietet die besten Wiederherstellungszeiten. Denn jedes einzelne Stück Daten ist auf mindestens einem Backup zu finden.

Alternativ kommt man mit den kürzesten Backup-Zeiten und dem geringsten Platz-Bedarf aus, wenn man wöchentlich ein vollständiges Backup vornimmt und in den Tagen dazwischen nur inkrementelle. Dann gibt es aber weniger Daten-Kopien, und die Wiederherstellung dauert am längsten, weil bis zu sechs Medien-Sätze gebraucht werden, um alle Informationen zusammenzubekommen. Wenn zum Beispiel am Mittwoch gesicherte Daten gebraucht werden, müssen das vollständige Backup von Sonntag plus die inkrementellen von Montag, Dienstag und Mittwoch herangezogen werden. Dadurch können Wiederherstellungen weitaus langsamer werden, und alle Medien-Sammlungen müssen vorliegen und funktionieren. Wenn nur eine Sammlung fehlt oder beschädigt ist, kann die Wiederherstellung scheitern.

Ein wöchentliches vollständiges Backup zusammen mit täglichen differenziellen ist eine Art Mittelweg zwischen den ersten beiden Strategien. Hier werden für eine Wiederherstellung zwar mehr Medien gebraucht als bei täglichen Voll-Backups, aber weniger als bei inkrementellen. Auch der Zeitaufwand für eine Wiederherstellung ist geringer als bei täglichen inkrementellen Backups, aber höher als bei täglichen vollständigen. Um Daten von einem bestimmten Tag zurückzubekommen, werden maximal zwei Medien-Sätze benötigt, was das Problem-Potenzial verringert.

Für Organisation mit überschaubaren Daten-Beständen kann es ein guter Schutz sein, täglich vollständige Backups laufen zu lassen, ohne dass die Storage-Kosten zu hoch werden. Für größere Organisationen oder solche mit mehr Daten dürfte ein Voll-Backup pro Woche, kombiniert mit inkrementellen oder differenziellen an jedem Tag, die bessere Option sein. Differenzielle Backups bieten dabei meist ein höheres Niveau an Daten-Sicherung und schnellere Wiederherstellung, verbunden mit etwas mehr Platz-Bedarf, und sind deshalb in vielen Fällen die beste Wahl.

Bei vielen der fortgeschritteneren Backup-Möglichkeiten wie synthetisch vollständig, Mirroring, revers inkrementell oder CDP sind als Backup-Ziele Festplatten erforderlich. Bei einem synthetisch vollständigen Backup wird automatisch ein vollständiges Backup aus den einzelnen inkrementellen oder differenziellen auf der Platte zusammengestückelt, das dann auch auf Band oder Offsite gespeichert werden kann und eine schnelle Wiederherstellung ermöglicht. Mit Mirroring wird das Kopieren von Disk-Storage auf anderes Disk-Storage bezeichnet; revers inkrementell lässt sich dabei zu einem früheren Mirror-Zustand zurückspringen. CDP schließlich erlaubt eine deutlich größere (im Prinzip unbegrenzte) Zahl von Wiederherstellungspunkten.

Wenn Sie über die richtige Backup-Strategie entscheiden, geht es also nicht nur darum, mit welchem Typ Sie arbeiten sollten. Überlegen Sie stattdessen, wann welcher Typ angemessen ist, und wie Sie die unterschiedlichen Optionen zusammen mit Tests so einsetzen können, dass Sie die Ziele Ihres Unternehmens hinsichtlich Kosten, Performance und Verfügbarkeit erreichen.

Über den Autor: Russ Fellows ist Senior-Analyst bei der Evaluator Group. Er leitet dort die Erforschung und Analyse von Produkten und Markttrends in den Bereichen NAS, virtuelle Band-Bibliotheken und Storage-Sicherheit. Außerdem ist er Hauptanalyst für mehrere Open-System-Arrays und Virtualisierungsprodukte.

Erfahren Sie mehr über Backup-Lösungen und Tools

ComputerWeekly.de
Close