vladimircaribb - Fotolia

Backup-Parameter: RPO und RTO im Vergleich

Anhand von RPO und RTO kann ein Unternehmen feststellen, wie viele Daten es verlieren kann und wie lange es ausfallen kann: Schlüsselelemente eines Backup- und DR-Plans.

Um die besten Ergebnisse bei der Datensicherung und -wiederherstellung (Backup und Recovery) zu erzielen, müssen zwei wichtige Messgrößen verwendet werden: Recovery Point Objective (RPO) und Recovery Time Objective (RTO). Beide Metriken sind bei der Entwicklung von Backup- und Recovery-Plänen sowie von herkömmlichen Plänen für Geschäftskontinuität (Business Continuity, BC) und Disaster Recovery (DR) von wesentlicher Bedeutung.

Es ist wichtig, jede dieser Metriken, ihre Rolle in den oben genannten Bereichen, ihre Berechnung und ihre Kostenauswirkungen zu untersuchen und herauszufinden, wie man sie in eine Vielzahl von Resilienz-Plänen einbauen kann.

Was ist RTO?

Recovery Time Objectives geben die Zeitspanne zwischen dem Auftreten eines störenden Ereignisses und dem Zeitpunkt an, zu dem die betroffene(n) Ressource(n) wieder voll einsatzfähig und bereit sein muss (müssen), um die Ziele der Organisation zu unterstützen. In Abbildung 1 ist die RTO-Metrik dargestellt.

Wenn eine Ressource gestört wird, sind möglicherweise mehrere Maßnahmen erforderlich, zum Beispiel der Austausch beschädigter Komponenten, Neuprogrammierung und Tests, bevor die Ressource wieder in Betrieb genommen und der normale Betrieb wieder aufgenommen werden kann. Es besteht eine umgekehrte Beziehung zwischen der Zeit für die Wiederherstellung und den Kosten, die für die Wiederherstellung erforderlich sind.

Je kürzer eine RTO in Bezug auf die Zeit ist, desto höher sind die Kosten für die Wiederherstellung, und umgekehrt. Daher ist es sehr wichtig, dass die Leiter der Geschäftsabteilungen an der Festlegung der RTO-Werte beteiligt werden. Sie könnten beispielsweise eine Wiederherstellungszeit von 30 Minuten als Zielvorgabe wünschen, aber die Kosten für die Erreichung dieses Ziels könnten unerschwinglich sein.

Abbildung 1: RTO kann in Sekunden, Minuten, Stunden oder Tagen bemessen sein.
Abbildung 1: RTO kann in Sekunden, Minuten, Stunden oder Tagen bemessen sein.

Was ist RPO?

Recovery Point Objective ist besonders wichtig, wenn es um Datensicherungs- und Wiederherstellungsaktivitäten geht. Unternehmen wie Banken oder Kreditkartenunternehmen, die im Laufe eines Tages viele Transaktionen durchführen, benötigen wahrscheinlich häufigere Backups, fast in Echtzeit, damit sie für künftige Transaktionen die aktuellen kritischen Daten für ihre spezifischen Anforderungen zur Verfügung haben.

Das bedeutet, dass die Daten seit der letzten Sicherung nicht sehr alt sein dürfen, das heißt die Daten müssen so aktuell wie möglich sein. Bei RPOs mit sehr niedrigen Werten, beispielsweise weniger als einer Minute, kann beispielsweise eine kontinuierliche Replikation wichtiger Dateien, Datenbanken und Systeme erforderlich sein. Dies ist der RPO, um die gesicherten Daten so aktuell wie möglich zu halten. In Abbildung 2 sind das RPO und seine Beziehung zum RTO dargestellt.

Auch hier zeigt sich ein umgekehrtes Verhältnis zwischen dem RPO-Wert und den Kosten für seine Erreichung. Ein sehr kurzer RPO, wie 10 bis 30 Sekunden, bedeutet, dass die Daten sehr häufig gesichert werden müssen, was den Einsatz von Hochgeschwindigkeits-Backup-Technologien wie Datenspiegelung oder kontinuierliche Replikation erforderlich macht, insbesondere wenn die Backups außerhalb des Standorts in einer Cloud oder einer anderen Einrichtung gespeichert werden. Hinzu kommt die Netzwerkbandbreite, die für die Übertragung großer Datenmengen benötigt wird, und die Kosten können erheblich sein, um die erforderliche Datenverfügbarkeit zu erreichen.

Abbildung 2: Ein RPO wird in der Zeit rückwärts vom Zeitpunkt des Auftretens des Fehlers ausgedrückt.
Abbildung 2: Ein RPO wird in der Zeit rückwärts vom Zeitpunkt des Auftretens des Fehlers ausgedrückt.

RTO vs. RPO: Gemeinsamkeiten und Unterschiede

Beide Metriken sind wichtige Elemente in Datensicherungs- und Datenwiederherstellungsplänen. Idealerweise sollten beide zu den wichtigsten Backup- und Recovery-Merkmalen gehören, um sicherzustellen, dass wichtige Daten und Systeme bei Bedarf verfügbar sind, insbesondere nach einem Störungsereignis. Tabelle 1 enthält weitere Einzelheiten zu den beiden Begriffen im Zusammenhang mit einem Post-Desaster-Szenario:

Tabelle 1

In diesem Beispiel wurden sowohl geschäftskritische Anwendungen als auch Datenbanken durch das Ereignis gestört. Die RPOs und RTOs waren für jede Anlage ziemlich aggressiv; die Ergebnisse zeigten, dass die Anlagen nicht so gut geschützt waren wie erwartet. Die für die Wiederherstellung benötigte Zeit deutet darauf hin, dass die Firma Folgendes benötigt:

  • Neukonfiguration von Speicherressourcen und Sicherungsplattformen für Anwendungsprioritäten
  • Ersatzteile, die im Rahmen des Wiederherstellungsprozesses verwendet werden können
  • stärkere Konzentration auf kritische Infrastruktur- und Umweltsysteme und Bemühungen zur Aufrechterhaltung des Geschäftsbetriebs

Abgesehen von ihrer Verwendung in Business-Continuity-Plänen und technologischen Disaster-Recovery-Plänen sind sie in der Praxis recht unterschiedlich. RTOs werden nach dem Eintreten eines Ereignisses festgelegt. RPOs werden vor dem Eintreten eines Ereignisses verwendet. Wenn beide jedoch miteinander verknüpft sind, erfordert ein kurzes RTO in der Regel ein ebenso kurzes RPO (siehe Tabelle 1), insbesondere wenn es um den Schutz der Daten geht. Wenn die DR-Strategie nur die Sicherung und Wiederherstellung von Systemen vorsieht (siehe Tabelle 1), kann ein RTO-Wert ausreichen, um zu bestimmen, wie die Wiederherstellung erfolgen soll. Wenn das wiederherzustellende System jedoch auch kritische Daten verarbeitet (siehe Tabelle 1), sollten beide Metriken synchronisiert werden.

Berechnung von RPO und RTO

Eine Business-Impact-Analyse (BIA) dient dazu, relevante RTO- und RPO-Werte zu ermitteln. Auch Risikoanalysen können einen wertvollen Beitrag zur Zuweisung von Werten für diese Metriken leisten. BIAs identifizieren geschäftskritische Prozesse und ermitteln die Technologien, Mitarbeiter und Einrichtungen, die zur Sicherstellung des normalen Geschäftsbetriebes erforderlich sind. Sie können auch die finanziellen Auswirkungen - wie Umsatzeinbußen oder Bußgelder - ermitteln, die durch die Unterbrechung verursacht werden.

Auf der Grundlage der Angaben von Geschäftsbereichsleitern und der Geschäftsleitung werden numerische Werte definiert, die die besten Szenarien für die Wiederherstellung nach einer Unterbrechung aus Unternehmenssicht darstellen. Nun gibt es keine mathematischen Formeln zur Berechnung von RTO/RPO-Werten. Es handelt sich um rein numerische Zeitwerte. Ein RTO für einen relativ kritischen Server könnte beispielsweise eine Stunde betragen, während das RPO für weniger kritische Datentransaktionsdateien 24 Stunden betragen und auch den Einsatz von Bandspeichergeräten unterstützen könnte.

Wie bereits erwähnt, steigen die Kosten für die Erreichung dieser Kennzahlen, wenn die numerischen RTO/RPO-Werte sinken. Die einzige Möglichkeit, die tatsächlichen Kosten zu ermitteln, besteht darin, zunächst die gewünschten RTO/RPO-Werte zu bestimmen und dann Nachforschungen anzustellen, um festzustellen, was erforderlich ist, um die Kennzahl im Falle einer Unterbrechung zu erreichen. Dann kann es erforderlich sein, die Leiter der Geschäftsbereiche und die Unternehmensleitung über die zusätzlichen Investitionen zu informieren.

Abbildung 3
Abbildung 3

Hier kann es zu Konflikten kommen, denn wenn die Geschäftsleitung keine zusätzlichen Mittel ausgeben will, um die gewünschten Kennzahlen zu erreichen, muss sie verstehen, dass ein solcher Widerstand im Falle einer Störung zusätzliche Risiken mit sich bringen kann. Im Idealfall muss die Geschäftsleitung über die potenziellen finanziellen Probleme und andere Auswirkungen eines Ereignisses, wie Rufschädigung, informiert werden, bevor sie eine Entscheidung trifft.

Tipps zum Erreichen von RPOs und RTOs

Auf der Grundlage der Ergebnisse von Risikoanalyse und BIA sollten IT-Administratoren eine gute Vorstellung von den Arten von Ereignissen haben, die die IT-Infrastruktur bedrohen könnten. Die Analysen können Bewertungen für Metriken liefern, die die Häufigkeit des Auftretens, die Wahrscheinlichkeit des Auftretens und die Auswirkungen auf die Organisation (zum Beispiel in betrieblicher und finanzieller Hinsicht) angeben, und sie können auch Schwachstellen (beispielsweise geringe Häufigkeit der Datensicherung für bestimmte Anwendungen) und potenzielle Bedrohungen (wie Stromausfälle aufgrund von Bauarbeiten in der Nähe) aufzeigen.

Sobald diese risikobasierten Probleme identifiziert und quantifiziert worden sind, können IT-Administratoren diese Faktoren in Infrastrukturwerte übersetzen und auf der Grundlage dieser Bewertung Maßnahmen ermitteln, die dazu beitragen können, die Bedrohungen zu verringern oder deren Schweregrad zu mindern, falls sie auftreten. Diese Analysen können dann in RPO- und RTO-Werte umgewandelt werden, die von der Geschäftsbereichsleitung und der Unternehmensleitung geprüft und genehmigt werden sollten. Unter der Voraussetzung, dass die Risiken akzeptiert wurden, kann die IT-Abteilung dann Maßnahmen ermitteln, die im Zuge der Festlegung realistischer RPO- und RTO-Werte zu ergreifen sind (zum Beispiel mehr Datenspeicher, mehr Netzwerkbandbreite, häufigere Überprüfung der Systemleistung).

Integration von RTO/RPO in Backup- und Recovery-Pläne

Die Einbeziehung von RTO/RPO-Kennzahlen in Datensicherungs-, Datenwiederherstellungs- und andere Ausfallsicherheitspläne (wie BC/DR) ist unerlässlich und stellt sicher, dass die Verfahren, das Personal und die technischen Ressourcen, die zur Erreichung der Kennzahlen eingesetzt werden, angemessen sind. RTO/RPO-Werte können als Referenz in die Pläne aufgenommen werden und zeigen an, wo die Messlatte für die Wiederherstellung gelegt wurde.

Für die Datensicherung und -wiederherstellung sind diese Kennzahlen für die Planung unerlässlich, da sie helfen, die optimale Datensicherungs- und Technologiekonfiguration zu bestimmen, um die Ziele zu erreichen. Sie sind auch aus der Sicht der Einhaltung von Vorschriften und der Rechnungsprüfung wichtig, da Prüfer beispielsweise nach Nachweisen für diese Werte als Schlüsselkontrollen für die Datensicherung und -wiederherstellung suchen könnten.

Erfahren Sie mehr über Datensicherheit

ComputerWeekly.de
Close