vladimircaribb - Fotolia

F

Backup-Metriken: Wie lassen sich RPO und RTO und verstehen?

RTO und RPO ermöglichen es einem Unternehmen zu wissen, wie viele Daten es verlieren kann und wie lange es ausfallen kann - Schlüsselelemente eines Backup- und DR-Plans.

Um die besten Ergebnisse bei der Datensicherung und -wiederherstellung zu erzielen, müssen zwei wichtige Metriken verwendet werden: Recovery Time Objective (deutsch: Wiederherstellungszeitziel) und Recovery Point Objective(deutsch: Wiederherstellungspunktziel). Beide Metriken sind bei der Entwicklung von Backup- und Recovery-Plänen sowie von traditionellen Business-Continuity- und Technologie-Disaster-Recovery-Plänen unerlässlich.

Es ist wichtig, jede dieser Metriken zu untersuchen, ihre Rolle in den oben genannten Bereichen, wie sie berechnet werden und ihre Kostenauswirkungen und wie sie in eine Vielzahl von Ausfallsicherheitsplänen eingebaut werden können.

Was ist RTO?

Recovery Time Objectives (RTOs) messen die Zeitspanne zwischen dem Auftreten eines Störfalles und dem Zeitpunkt, an dem die betroffenen Ressourcen wieder voll einsatzfähig und bereit sein müssen, um die Ziele der Organisation zu unterstützen. In Abbildung 1 ist die RTO-Metrik dargestellt.

Abbildung 1: RTO kann in Sekunden, Minuten, Stunden oder Tagen bemessen sein.
Abbildung 1: RTO kann in Sekunden, Minuten, Stunden oder Tagen bemessen sein.

Wenn eine Ressource ausfällt, sind möglicherweise mehrere Aktionen erforderlich, beispielsweise der Austausch beschädigter Komponenten, Neuprogrammierung und Tests, bevor die Ressource wieder in Betrieb genommen werden kann und der übliche Geschäftsbetrieb wieder möglich ist. Es besteht eine umgekehrte Beziehung zwischen der Zeit für die Wiederherstellung und den Kosten, die zur Unterstützung der Wiederherstellung erforderlich sind. Je kürzer eine RTO in Bezug auf die Zeit ist, desto höher sind die Kosten für die Wiederherstellung, und umgekehrt. Daher ist es sehr wichtig, dass die Leiter der Geschäftseinheiten bei der Festlegung der RTO-Werte beteiligt werden. Sie könnten zum Beispiel eine 30-minütige Wiederherstellung als Zielzeit wünschen, aber die Kosten, um dieses Ziel zu erreichen, könnten unerschwinglich sein.

Was ist RPO?

Recovery Point Objective (RPO) ist besonders wichtig, wenn es um Datensicherungs- und Wiederherstellungsaktivitäten geht. Organisationen – zum Beispiel Banken, Kreditkartenunternehmen -, die im Laufe eines Tages viele Transaktionen durchführen, müssen Backups wahrscheinlich häufiger, fast in Echtzeit, durchführen, damit sie die aktuellsten kritischen Daten für ihre spezifischen Anforderungen für zukünftige Transaktionen zur Verfügung haben. Das bedeutet, dass die Daten seit dem letzten Backup nicht sehr alt werden dürfen, das heißt die Daten sollen so aktuell wie möglich sein. Dies ist der RPO, um gesicherte Daten so aktuell wie möglich zu haben. In Abbildung 2 sind RPO und die Relation zu RTO dargestellt.

Abbildung 2: Ein RPO wird in der Zeit rückwärts vom Zeitpunkt des Auftretens des Fehlers ausgedrückt.
Abbildung 2: Ein RPO wird in der Zeit rückwärts vom Zeitpunkt des Auftretens des Fehlers ausgedrückt.

Auch hier zeigt sich eine umgekehrte Beziehung zwischen dem RPO-Wert und den Kosten, um ihn zu erreichen. Ein sehr kurzer RPO, zum Beispiel 10 bis 30 Sekunden, bedeutet, dass die Daten sehr häufig gesichert werden müssen, was den Einsatz von Hochgeschwindigkeits-Backup-Technologien wie Datenspiegelung oder Replikation erforderlich macht, insbesondere wenn die Backups außerhalb des Standorts in einer Cloud oder einen anderen Standort gespeichert werden. Hinzu kommt die Netzwerkbandbreite, die für die Übertragung großer Datenmengen benötigt wird, und die Kosten können erheblich sein, um die erforderliche Datenverfügbarkeit zu erreichen.

Zentrale Gemeinsamkeiten und Unterschiede

Beide Metriken sind wichtige Elemente, die in Datensicherungs- und Datenwiederherstellungsplänen verwendet werden. Idealerweise sollten beide zu den wichtigsten Backup- und Recovery-Funktionen gehören, um sicherzustellen, dass kritische Daten und Systeme bei Bedarf verfügbar sind, insbesondere nach einem Störfall.

Abgesehen von ihrer Verwendung in Wiederherstellungsplänen sind sie in der Praxis recht unterschiedlich. RTOs werden nach Eintreten eines Ereignisses festgelegt. RPOs werden vor dem Eintreten eines Ereignisses verwendet. Wenn die beiden jedoch miteinander verbunden sind, erfordern kurze RTOs in der Regel ebenso kurze RPOs, insbesondere wenn es um den Schutz der Daten geht. Wenn wir nur die Sicherung und Wiederherstellung von Systemen betrachten, kann ein RTO-Wert ausreichen, um zu bestimmen, wie die Wiederherstellung erfolgen soll. Wenn das wiederherzustellende System jedoch auch kritische Daten verarbeitet, dann sollten beide Metriken synchronisiert werden.

Berechnung von RPO und RTO

Eine Business-Impact-Analyse (BIA) dient dazu, relevante RTO- und RPO-Werte zu ermitteln. Auch Risikoanalysen können einen wertvollen Beitrag zur Zuweisung von Werten für diese Metriken leisten. BIAs identifizieren unternehmenskritische Geschäftsprozesse und ermitteln die Technologien, Mitarbeiter und Einrichtungen, die zur Sicherstellung des normalen Geschäftsbetriebs benötigt werden. Sie können auch die finanziellen Auswirkungen - beispielsweise Umsatzverluste oder Geldstrafen - ermitteln, die durch die Unterbrechung verursacht werden.

Basierend auf dem Input der Leiter der Geschäftseinheiten und des Senior Managements werden numerische Werte definiert, die die Best-Case-Szenarien für die Wiederherstellung nach Unterbrechungen aus geschäftlicher Sicht darstellen. Nun gibt es keine mathematischen Formeln zur Berechnung von RTO/RPO-Werten. Es handelt sich um rein numerische Zeitwerte. Beispielsweise könnte ein RTO für einen ziemlich kritischen Server eine Stunde betragen, während das RPO für weniger kritische Datentransaktionsdateien 24 Stunden betragen könnte und auch die Verwendung von Backup-Bandspeichergeräten unterstützen könnte.

Wie bereits erwähnt, steigen die Kosten zum Erreichen dieser Metriken, wenn die numerischen RTO/RPO-Werte sinken. Die einzige Möglichkeit, die wahren Kosten zu ermitteln, besteht darin, zunächst die gewünschten RTO/RPO-Werte zu identifizieren und dann Nachforschungen anzustellen, um festzustellen, was erforderlich ist, um die Metrik zu erreichen, wenn eine Störung auftritt. Es könnte dann notwendig sein, die Leiter der Geschäftseinheiten und das Senior Management über die zusätzlichen Investitionen zu informieren.

Hier kann es zu Konflikten kommen, denn wenn das Management keine zusätzlichen Mittel ausgeben möchte, um die gewünschten Metriken zu erreichen, die es festgelegt hat, muss es verstehen, dass ein solcher Widerstand zusätzliche Risiken mit sich bringt, wenn ein Störungsereignis eintritt. Idealerweise muss das Management über die potenziellen finanziellen Probleme und andere Auswirkungen eines Ereignisses – zum Beispiel Rufschädigung - aufgeklärt werden, bevor es eine Entscheidung trifft.

Einbindung von RTO/RPO in Datensicherungs- und Wiederherstellungspläne

Die Einbeziehung von RTO/RPO-Metriken in Datensicherungs-, Datenwiederherstellungs- und andere Ausfallsicherheitspläne (zum Beispiel BC/DR) ist unerlässlich und stellt sicher, dass die Verfahren, das Personal und die technischen Ressourcen, die zur Erreichung der Metriken eingesetzt werden, angemessen sind. RTO/RPO-Werte können als Referenz in die Pläne aufgenommen werden und zeigen an, wo die Wiederherstellungszielwerte gelegt wurden.

Für die Datensicherung und -wiederherstellung sind diese Metriken für die Planung unerlässlich, da sie helfen, die optimale Datensicherungs- und Technologiekonfiguration zu bestimmen, um die Ziele zu erreichen. Sie sind auch aus Compliance- und Audit-Perspektive wichtig, da Auditoren beispielsweise nach Nachweisen für diese Werte als Schlüsselkontrollen für die Datensicherung/Wiederherstellung suchen könnten.

Fortsetzung des Inhalts unten

Erfahren Sie mehr über Datensicherheit

ComputerWeekly.de

Close