
WavebreakmediaMicro - Fotolia
Eine starke Strategie für Disaster-Recovery-Tests erstellen
Tests sind ein essenzieller Teil der Disaster-Recovery-Strategie. Ohne ordnungsgemäße Tests könnten IT-Teams wichtige Updates verpassen oder beim Recovery vermeidbare Fehler machen.
Gute Disaster-Recovery-Tests (Wiederherstellungstests) sind das Ergebnis einer gründlichen Planung und Vorbereitung. Ein nicht getesteter Disaster-Recovery-Plan (DR-Plan) birgt erhebliche Risiken, da er im Ernstfall möglicherweise nicht wie geplant funktioniert. Deshalb ist es entscheidend, eine Teststrategie für das Disaster Recovery zu entwickeln und regelmäßig umzusetzen. Disaster-Recovery-Tests helfen dabei, Schwachstellen im Plan aufzudecken, die Einhaltung von Wiederherstellungszielen (RPO/RTO) zu überprüfen und sicherzustellen, dass alle Beteiligten ihre Aufgaben im Notfall kennen. Ohne Tests bleibt ein DR-Plan eine Theorie, die im Ernstfall zu einer weiteren Krise führen kann. Viele Unternehmen können nicht regelmäßig einen vollständigen Disaster-Recovery-Plan testen. Die Planung und Durchführung eines Disaster-Recovery-Tests erfordern zwei wertvolle Ressourcen: Zeit und Geld. Allein aus diesem Grund müssen DR-Teams realistisch einschätzen, wie viele Tests sie pro Jahr durchführen können. Die meisten wichtigen Anwendungen werden höchstens einmal im Jahr einem End-to-End-Test unterzogen. Einige Anwendungen können einmal alle drei Jahre getestet werden. Das hängt von den Anforderungen des DR-Teams ab.
Dies bringt Disaster-Recovery-Teams in ein Dilemma: Wenn sie nicht oft genug testen können, könnten kritische Anwendungen oder Prozesse notwendige Aktualisierungen verpassen. Wenn sie sich jedoch zu sehr mit überflüssigen Tests aufhalten, riskieren sie, die oben erwähnten wertvollen Ressourcen zu verbrauchen. Eine Teststrategie muss fast so gründlich sein wie die Wiederherstellung selbst. So wird sichergestellt, dass die DR-Teams keine erforderlichen Änderungen verpassen und selbst begrenzte Ressourcen optimal nutzen können.
Um das Beste aus einer Disaster-Recovery-Teststrategie herauszuholen, sollten Sie die folgenden Best Practices berücksichtigen.
Bestimmen Sie die Art des Tests und planen Sie entsprechend
Es gibt zwei Arten von Disaster-Recovery-Tests: vollständige DR-Tests und Komponententests. Der Unterschied besteht darin, dass Komponententests kleiner sind und eine Teilmenge der Anwendung testen. Bei den meisten Komponententests handelt es sich um eine Art Smoke-Test, mit dem sichergestellt werden soll, dass die kleineren Teile der Gesamtanwendung funktionieren, bevor erhebliche Ressourcen für einen vollständigen DR-Test eingesetzt werden.
Bevor Sie sich mit den technischen Aspekten des Tests befassen, sollten Sie sich darüber im Klaren sein, was getestet wird. Handelt es sich um einen vollständigen interaktiven Disaster-Recovery-Test, bei dem die Benutzer aufgefordert werden, sich anzumelden, in einem Krisenszenario zu agieren und zu beweisen, dass die Anwendung wie erwartet funktioniert? Oder reicht es aus, zu überprüfen, ob die Systeme und die Software verfügbar sind? Je nach Tools oder Prozessen im DR-Plan eines Unternehmens kann es erforderlich sein, einen vollständigen Durchlauf des Plans durchzuführen, um zu testen, wie er im Krisenfall funktioniert.
Frühzeitig gut vorbereiten und gründlich überprüfen
Es mag trivial erscheinen, aber es gehört zu den häufigsten und vermeidbaren Fehlern von Unternehmen, wichtige Komponenten nicht zu überprüfen, bevor ein vollständiger Test durchgeführt wird. Der Sinn eines DR-Tests besteht darin, sicherzustellen, dass die Dinge wie erwartet funktionieren. Wenn es jedoch eine Korrektur gibt, die außerhalb des vollständigen Tests durchgeführt werden kann, lohnt es sich, vorher zu überprüfen, ob alles bereit ist. Dies ist ein Bereich, in dem Komponententests sehr nützlich sein können.
Ein häufiges Beispiel ist, wenn ein IT-Team feststellt, dass erforderliche Firewall-Ports nicht geöffnet sind. Dies könnte zwar während des vollständigen DR-Tests festgestellt werden, aber es ist dennoch einfacher, dies im Voraus zu überprüfen, um Zeit und Ressourcen zu sparen. Die Behebung von Firewall-Problemen kann ein frustrierender Prozess sein, mit dem sich die Sicherheits- und Netzwerkmitarbeiter nicht mitten in einem vollständigen DR-Test befassen möchten.
Gute Dokumentation ist immer essenziell
Die Bedeutung einer guten Dokumentation ist von größter Bedeutung. Wenn ein DR-Test von weniger erfahrenen Mitarbeitern durchgeführt wird, können diese im Laufe des Tests auf verschiedene Probleme stoßen und diese lösen. Wenn sie diese Probleme und deren Behebung jedoch nicht dokumentieren, kann der Verlust wichtiger Informationen die Geschwindigkeit des DR-Tests oder der tatsächlichen Wiederherstellung erheblich beeinträchtigen.
Es gibt vier Arten von Dokumentationen, über die DR-Teams für eine solide Teststrategie verfügen müssen:
- Der aktuelle DR-Plan in seiner schriftlichen Form, mit einzelnen Schritten und einem Zeitplan.
- Notizen zu allen Problemen, die während der Tests auftraten, und wie sie behoben wurden. Wenn es eine vorübergehende Umgehung gab, beschreiben Sie, wie diese angelegt war.
- Detaillierte Dokumentation des Testprozesses. Dazu gehört, was getestet wird und von wem.
- Bestätigung des Testabschlusses durch den Administrator.
Gründliche Nachbereitung und Berichterstattung ist unerlässlich
Es mag einfach erscheinen, aber die Berichterstattung nach dem Test ist der Punkt, an dem viele DR-Teams versagen. Leider ist dies die Aufgabe, die auf der Managementebene die größte Wirkung und Präsenz hat.
Das Management zeigt häufig wenig Interesse an den technischen Details der IT, doch die Kommunikation von Erfolgen oder Misserfolgen auf strategischer Ebene stellt eine anspruchsvolle Herausforderung dar. Dies gilt insbesondere, wenn ein Produktionssystem zum Testen eines DR-Szenarios heruntergefahren wird. Genau wie bei einer echten Katastrophe sollten IT-Teams während des gesamten Prozesses eine umfassende Dokumentation erstellen, um das Management über den Verlauf des Tests und die Bereiche zu informieren, die es zu beheben gilt.
Um zu vermeiden, dass das Management bei der Nachbereitung mit technischen Details überfordert wird, ist eine rechtzeitige Kommunikation des Status auf höchster Ebene während des Tests entscheidend. Bedenken Sie, dass die Durchführung einiger DR-Tests recht langwierig sein kann und sich über 24 Stunden oder mehr erstreckt. Indem Sie die wichtigsten Stakeholder regelmäßig über den aktuellen Stand informieren, fördern Sie Zufriedenheit und demonstrieren eine effektive Kommunikationskultur.