Fault Tolerance
Fault Tolerance, also die Fehlertoleranz, beschreibt ein Computersystem oder eine Komponente, wenn deren Design bei einem Ausfall einer Komponente durch Rückgriff auf Backup-Komponenten oder bestimmte andere Prozeduren unverzüglich und unterbrechungsfrei für Ersatz sorgt. Fault Tolerance kann durch Software erreicht werden, in Hardware eingebaut sein oder durch eine Kombination beider Möglichkeiten erzielt werden.
Fortsetzung des Inhalts unten


IT-Prioritäten in der Pandemie: Wie COVID-19 die IT-Budgets verändert
2020 brachte ungeahnte Herausforderungen für die IT-Verantwortlichen. Die Pandemie wirkt sich auch auf zukünftige IT-Budgets und -Pläne aus, wie die TechTarget-Umfrage zeigt. Erfahren Sie in diesem E-Guide, welche Veränderungen die Pandemie bei den Prioritäten auslöste.
Als Software-Implementierung stellt das Betriebssystem dem Programmierer eine Schnittstelle zur Verfügung, die diesem eine Überprüfung kritischer Daten zu vorherbestimmten Zeitpunkten innerhalb einer Transaktion erlaubt. Im Zuge einer Hardwarelösung muss der Programmierer sich der fehlertoleranten Fähigkeiten der Maschine hingegen noch nicht einmal bewusst sein.
Auf Hardwareebene wird Fault Tolerance meist durch doppelte Ausführung jeglicher Komponenten der Hardware erreicht. Laufwerke beispielsweise werden gespiegelt. Mehrere Prozessoren werden per „lock-step“ aneinander gekoppelt und ihre Ausgaben auf Korrektheit geprüft. Tritt eine Anomalie auf, so wird die fehlerbehaftete Komponente erkannt und aus dem Betrieb genommen, während die Maschine insgesamt weiter funktioniert wie üblich.
VMware hat das Prinzip der Fehlertoleranz als Produkt VMware Fault Tolerance übernommen.