Mit Soft- und Hardware die Ausfallsicherheit virtueller Server erhöhen

Mit einem Mix aus Hardware- und Software-Technologie schützen Sie Ihre Server und somit virtuellen Maschinen sowie deren Workloads vor Ausfällen.

Welchen Hardware- und Software-Optionen stehen zur Verfügung, um die Ausfallsicherheit virtueller Server zu erhöhen?

Die Erhöhung der Ausfallsicherheit fängt bei der umsichtigen Wahl der Server-Hardware und deren Funktionen an. Beginnen Sie bei einem Server mit redundanter Stromversorgung. Server der Enterprise-Klasse kommen in der Regel mit zwei modularen Netzteilen. Jedes davon kann den Server individuell betreiben. Sollte ein Netzteil ausfallen, springt das zweite sofort ein und der Server kommt nicht zum Erliegen. Redundante Netzteile sind mit Sicherheit keine neue Erfindung. Allerdings ist es wichtig, ältere Server mit nur einer Stromversorgung in künftigen Technologie-Auffrischungs-Zyklen entsprechend zu ersetzen.

Virtuelle Maschinen (VM) laufen als Abbilder oder Images im Arbeitsspeicher des Servers. Administratoren können also die Verfügbarkeit der Server damit verbessern, indem Sie Systeme mit Augenmerk auf Ausfallsicherheit beim Arbeitsspeicher wählen. Ein Beispiel wäre Memory Module Sparing, auch Hot Spring genannt. In diesem Fall besitzt der Server ein zusätzliches Speicher-Modul, das auf Bereitschaft steht. Sollte der Server in einem Modul Fehler erkennen, kann dieses Standby-Modul sofort einspringen. So genanntes Memory Patrol Scrubbing kümmert sich vor der Adressierung des Speichers proaktiv, damit Speicher-Fehler lokalisiert und korrigiert werden können. Double Device Data Correction (DDDC) erlaubt es dem Server, sich auch von simultanen Multi-Bit-Fehlern auf zwei Speicher-Chips zu erholen. Erweitertes DDDC (auch DDDC+1 genannt) kann einen weiteren Single-Bit-Fehler erkennen und korrigieren. Somit ist der Schutz erweitert. Memory Mirroring (Spiegelung) dupliziert im Grunde genommen die Inhalte des Arbeitsspeichers auf ein zweites Modul. Somit haben Sie effektiv ein RAID 1 im Hinblick auf den Arbeitsspeicher.

Eine weitere Maßnahme in Bezug auf Ausfallsicherheit ist, den Server mit mehreren Netzwerk-Schnittstellen auszustatten. Solange die gesamte Hardware ordnungsgemäß läuft, können die extra Netzwerkkarten oder Ports zusätzliche Bandbreite liefern. Somit ist die Verbindung zu allen Server-Workloads sichergestellt. Sollte eine Netzwerk-Karte ausfallen, ist der Server aber immer noch mit dem Netzwerk verbunden. Damit minimieren Sie die Störung der virtuellen Maschinen.

Allerdings ist es nicht damit getan, einfach robustere und ausfallsicherere Gerätschaft zu kaufen. Administratoren müssen unbedingt Policies und Prozeduren erstellen, um potentielle Server-Ausfälle zu adressieren. Denken Sie daran, dass die Technologie für Ausfallsicherheit einen Server nicht immun vor einem kompletten Ausfall macht. Sie hilft lediglich den Server am Laufen zu halten, wenn Fehler auftreten. Fällt ein Speicher-Modul oder ein Netzteil aus, ist die Ausfallsicherheit des Servers kompromittiert. Techniker müssen dann zunächst Reparaturarbeiten durchführen. Behalten Sie auch die Benachrichtigung (Alarming), Failover-Prozesse und das Troubleshooting im Hinblick auf virtualisierte Server im Hinterkopf.

Software-Tools für die Ausfallsicherheit virtuellerServer

Einer der effizientesten Ansätze im Hinblick auf Ausfallsicherheit Unternehmens-kritischer Server ist die Verwendung von Server-Clustern. Cluster bestehen aus einer Gruppe von Servern, von denen jeder redundante virtuelle Maschinen betreibt. Fällt ein Server aus, nimmt die Clustering-Software diesen aus dem Cluster. Gleichzeitig springen Kopien der virtuellen Maschinen ein und der Anwender merkt im Idealfall keine Störung. Einer der Hauptvorteile bei Clustering ist, dass die Server des Clusters oftmals keine High-Reliability-Features (Funktionen für hohe Ausfallsicherheit) brauchen. Die Kontrolle wird einfach einem anderen Server im Cluster zugewiesen.

Tools wie zum Beispiel everRun von Stratus Technologies gehen ganz ähnlich an die Problematik heran. Die Software unterstützt synchronisierte Kopien ausgewählter Workloads auf unterschiedlichen Servern. Wird die Original-Workload unterbrochen, springt das Duplikat ein und wird mit minimaler Unterbrechung (wenn überhaupt) aktiv. Auch wenn es sich dabei nicht um einen Cluster im eigentlichen Sinne handelt, kommen Sie mit der Redundanz ans das Niveau von echtem Clustering heran.

Es gibt auch andere Varianten, die diese Idee verfolgen. Hypervisoren wie zum Beispiel von VMware bieten High-Availability-Tools an. Diese sind in der Lage, betroffene virtuelle Maschinen auf einem anderen Server zu starten. Die Workload kann wegen des Startvorgangs kurzfristig gestört sein. Dennoch hilft diese Art von Automatisierung einem Unternehmen, Workload-Probleme bei geeigneten Applikationen zu adressieren.

Das sind einige einfach Beispiele für Software-Optionen, die Ihnen hinsichtlich Hochverfügbarkeit für wichtige Enterprise-Workloads beiseite stehen können. Administratoren müssen diese Tools in Relation zum Nutzen betrachten. Danach stellen Sie sicher, dass virtuellen Maschinen ausreichend geschützt sind.

Erfahren Sie mehr über Disaster Recovery

ComputerWeekly.de

Close