Disaster Recovery-Definitionen

  • #

    3-2-1-Backup-Strategie

    Die 3-2-1-Backup-Regel ist eine bewährte Sicherungsmethode. Sie gibt vor, drei Datenkopien auf zwei verschiedenen Medien und an einem externen Standort vorzuhalten.

  • A

    Änderungskontrolle – Change Control

    Will ein Kunden Änderungen an einer Software haben, setzt man auf die systematische Herangehensweise Change Control oder Änderungskontrolle.

  • B

    Backup

    Ein Backup ist ein Datensicherungsprozess, bei dem mehrere Datenkopien an verschiedenen Standorten abgelegt werden, um diese bei Bedarf für eine Wiederherstellung nutzen zu können.

  • Backup auf Band (Tape Backup)

    Ein Tape Backup ist der Prozess, bei dem Daten auf Magnetbändern gespeichert werden. Das Backup auf Band dient als Basis für Datenwiederherstellungen in Notfällen.

  • Backup Storage (Backup-Speicher)

    Backup Storage dient der Aufbewahrung von Kopien der Produktivdaten eines Unternehmens. Als Backup-Speicher können lokale Storage-Systeme oder Cloud-Storage genutzt werden.

  • Bare Metal Restore

    Bare Metal Restore ist eine Wiederherstellungsmethode, bei der ein ausgefallenes System mittels eines Images auf identischer Hardware wiederhergestellt werden kann.

  • Business Continuity (Geschäftskontinuität)

    Business Continuity ist der englische Begriff für Geschäftskontinuität und bedeutet, dass eine Firma in der Lage ist, Geschäftsprozesse während eines Störfalls aufrecht zu erhalten.

  • Business Continuity Policy

    Eine Business Continuity Policy ist eine Reihe von Standards und Richtlinien, die eine Firma umsetzt, um seine Widerstandsfähigkeit und ein gutes Risikomanagement sicherzustellen.

  • Business Continuity und Disaster-Recovery (BC/DR)

    Business Continuity und Disaster-Recovery (BCDR oder BC/DR) gehören heutzutage zusammen, damit man bei einem Desaster schnell reagieren und Betriebsprozesse aufrecht erhalten kann.

  • Business-Continuity-Plan-Audit

    Ein Business-Continuity-Plan-Audit stellt sicher, dass der Plan für die Geschäftskontinuität bei einem Betriebsausfall funktioniert und alle notwendigen Maßnahmen enthalten sind.

  • Business-Impact-Analyse (BIA)

    Eine Business-Impact-Analyse ist ein systematischer Prozess, der Auswirkungen einer Unterbrechung kritischer Geschäftsabläufe infolge eines Notfalls bewertet.

  • C

    Call Tree oder Anfrufbaum

    Im Falle eines Problems hilft ein so geannnter Call Tree, alle wichtigen Mitarbeiter auch außerhalb der Geschäftszeiten in Kenntnis zu setzen.

  • Cloud Disaster Recovery (Cloud DR)

    Bei einem Cloud Disaster Recovery werden Services der Public Cloud genutzt, beispielsweise um Backup-Daten in der Cloud zu nutzen oder ein Recovery in der Cloud zu durchzuführen.

  • Cluster

    In einem Cluster werden verschiedene Ressourcen zusammengefasst, die als eine Lösung die bestmögliche Leistung und Funktionalität zur Verfügung stellen soll.

  • Cluster Quorum Disk

    Eine Cluster Quorum Disk bezeichnet das Speichermedium, auf dem die Konfigurationsdatenbank eines Hochverfügbarkeits-Clusters gespeichert ist.

  • Cyberresilienz (Cyber Resilience)

    Mit Cyberresilienz wird die Widerstandsfähigkeit eines Systems, eines Unternehmens oder einer Organisation bezeichnet, um einen Cyberangriff möglichst unbeschadet zu überstehen.

  • D

    Data Availability (Datenverfügbarkeit)

    Datenverfügbarkeit bezeichnet die Sicherstellung, dass Daten jederzeit oder mit nur minimaler Ausfallzeit zuverlässig und schnell für autorisierte Nutzer und Systeme zugänglich sind.

  • Datenverlust (Data Loss)

    Datenverlust ist die willentliche oder unbeabsichtigte Zerstörung digitaler Informationen. Dies kann durch menschliches Versagen, IT-Ausfälle oder Cyberangriffe verursacht werden.

  • Datenwiederherstellung (Data Restore)

    Für eine Datenwiederherstellung nutzt der Admin ein Backup, um verlorene oder geschädigte Daten am Ausgangsstandort oder an anderer Stelle wiederherzustellen und verfügbar zu machen.

  • Digitale Forensik und Incident Response (DFIR)

    Bei DFIR werden digitale Forensik und Vorfallreaktion kombiniert. Die Integration der Abläufe bietet Unternehmen viele Vorteile, ist aber auch mit Herausforderungen verbunden.

  • Disaster Recovery as a Service (DRaaS)

    Disaster Recovery as a Service ist ein Cloud-Angebot, das sein Failover im Falle einer Störung in eine externe Umgebung ermöglicht. Dafür gibt es drei Bereitstellungsmodelle.

  • Disaster Recovery nach Naturkatastrophen

    Ein Disaster Recovery nach einer Naturkatastrophe unterscheidet sich von einem DR nach ei-nem IT-Ausfall oder einem Ransomware-Angriff, da es physische Umstände zu beachten gibt.

  • Disaster-Recovery-Plan (DRP)

    Mit einem Disaster-Recovery-Plan legt eine Firma Prozesse, Teams und Anweisungen fest, die bei einem Störfall, Cyberangriff oder Datenverlust schnell zur Normalität führen sollen.

  • Disaster-Recovery-Team

    Ein DR-Team ist verantwortlich für die Wiederherstellung der Betriebsprozesse nach einem Störfall. Das kann unter anderem Datenwiederherstellung oder Hardwareersatz bedeuten.

  • Disaster-Recovery-Test

    Ein Disaster-Recovery-Test validiert die Einsatz- und Funktionsfähigkeit der Notfallplanung. Die Tests sollten regelmäßig erfolgen und aktualisiert werden, damit sie nutzbar sind.

  • Docker Image

    Docker Images enthalten Codes und Anleitungen, um Docker Container zu erstellen und auszuführen. Sie sind schreibgeschützt und können als Snapshot und Vorlage für Container dienen.

  • F

    Failback

    Ein Failback erfolgt nach einem Failover, bei dem vom Primärsystem auf ein anderes ausgewichen wurde. Das Failback sorgt für die Synchronisation und den Neustart am Primärsystem.

  • Failover

    Ein Failover ist ein Backup- oder Recovery-Prozess, um den Ausfall einer Systemkomponente oder einer gesamten Infrastruktur in kurzer Zeit abfedern zu können.

  • Failover Cluster

    Ein Failover Cluster ist eine Ansammlung von redundanten Servern, die Hochverfügbarkeit gewährleisten oder als Ausweichumgebung beim Ausfall der Primärsysteme dienen.

  • Fault Tolerance (Fehlertoleranz)

    Fehlertoleranz ist die Fähigkeit eines Systems, trotz Ausfällen oder Fehlern zu funktionieren. Sie nutzt Redundanz und automatische Fehlerbehebung, um Stabilität zu garantieren.

  • Forensisches Abbild

    Ein forensisches Abbild ist eine Bit-für-Bit-, Sektor-für-Sektor-Kopie eines physischen Datenträgers, einschließlich aller Dateien, freiem und nicht zugewiesenem Speicherplatz.

  • G

    Google Cloud Storage

    Google Cloud Storage ist ein Service, der Storage in einer Public Cloud bereitstellt. Der Kunde kann zwischen Speicherklassen und regionalen sowie multiregionalen Redundanzen wählen.

  • I

    IBM (International Business Machines)

    IBM ist ein großes international agierendes Unternehmen, dass bereits Anfang des 20. Jahrhunderts gegründet wurde und sich sehr früh auf IT-Lösungen spezialisierte.

  • Incident (Vorfall, Zwischenfall)

    Ein Incident oder Vorfall ist ein Ereignis, der den Betrieb eines Unternehmens stört, unterbricht oder ausfallen lässt. Cyberattacken sind ebenso Vorfälle wie ein Hardwareausfall.

  • Inkrementelles Backup

    Inkrementelle Backups sparen Speicherplatz, Zeit und Bandbreite da nur Änderungen seit dem letzten Backup gesichert werden. Beim Recovery ist zusätzlich das Voll-Backup notwendig.

  • Instant Recovery

    Instant Recovery oder Recovery-in-Place bedient sich Snapshots von virtuellen Maschinen, um bei Systemausfall eine sofortige Wiederherstellung zu garantieren.

  • ISO 22301 (International Organization of Standardization)

    Der ISO-Standard 22301 definiert Sicherheitsanforderungen und Planungsvorgaben für Disaster Recovery und Business Continuity Management-Systeme sowie das Krisenmanagement.

  • K

    Kommunikationsplan

    Dank eines Kommunikationsplan können Informationen übermittelt werden. Dieser richtlinienorientierte Ansatz spielt gerade im Change Management eine wichtige Rolle.

  • Krisenkommunikation

    Krisenkommunikation ist ein wichtiger Teil des Krisenmanagements, bei dem Mitarbeiter, Partner, Kunden und Öffentlichkeit über notwendige Details eines Störfalls informiert werden.

  • Krisenmanagementplan

    Ein Krisenmanagementplan definiert Reaktionen auf kritische Situationen, benennt Verantwortliche, legt Kommunikationswege fest und minimiert Schäden für Firmen und Stakeholder.

  • M

    MTTR (Mean Time To Repair)

    Die MTTR (Mean Time to Repair) beschreibt die durchschnittliche Zeit, die benötigt wird, um ausgefallene Geräte oder Systeme zu reparieren und wieder in Betrieb zu nehmen.

  • N

    Network Downtime (Netzwerkausfallzeit)

    Die Unerreichbarkeit eines Netzwerks oder eines Teils wird als Network Downtime bezeichnet. Ursache kann der Ausfall von Hardware, Software oder einer Kombination von beidem sein.

  • Notfallbenachrichtigung

    Die Notfallbenachrichtigung ist ein Prozess, bei dem eine Firma oder eine Behörde eine große Anzahl an Personen – Mitarbeiter, Kunden oder Anwohner – über eine Störung informiert.

  • P

    POST (Power-On Self-Test)

    Nach dem Einschalten führt ein PC zunächst einen Selbsttest durch, den Power-On Self-Test. Dabei wird geprüft, ob die wesentliche Hardware vorhanden ist und ob sie funktioniert.

  • R

    Redundanz (redundant)

    Redundanz bedeutet das Vorhalten mehrerer gleicher Dinge, beispielsweise Daten. Doppelte Daten können Vorteile bei einem Datenverlust bringen, haben aber auch Nachteile.

  • Replikation

    Bei der Replikation wird eine Kopie – also eine Replik – von daten oder Datensätzen angefertigt und an einem zweiten Speicherstandort für den Fall des Datenverlustes vorgehalten.

  • S

    Systemwiederherstellung (System Restore)

    Durch das Dienstprogramm Systemwiederherstellung (System Restore) von Microsoft Windows wird das Betriebssystem geschützt und auf einen früheren Zustand zurückgesetzt.

  • „Split Brain“-Problem

    Bei einem „Split Brain“-Problem ordnen sich Nodes nach einem Ausfall zu zwei gleich großen Clustern und es droht ein Datenverlust.

  • T

    Tabletop-Übung

    Tabletop-Übungen funktionieren wie Rollenspiele, bei denen Mitarbeiter ihre Handlungen im Falle einer Störung durchführen und so deren Wirksamkeit testen.

  • V

    Virtual Disaster Recovery (Virtuelles Disaster Recovery)

    Bei einem virtuellen Disaster Recovery erfolgt die Wiederherstellung von Daten in einer virtuellen Umgebung und nicht auf physischen Systemen im eigenen Rechenzentrum.

  • W

    Windows File Share Witness (FSW)

    Ein Windows File Share Witness (FSW) kommt in Hochverfügbarkeits-Clustern zum Einsatz und sichert den Weiterbetrieb beim Ausfall eines Standortes.

  • Z

    Zentralisierte Backups

    Ein zentrales Backup kann eine Vereinfach bei der Verwaltung der Backups bedeuten, andererseits steigt der Zeitaufwand für eine Datensicherung.