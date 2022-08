Unternehmen hängen heute mehr denn je von ihrer IT ab. Ein vorausschauendes Systemmanagement hilft, Ausfallzeiten zu minimieren und den Betrieb der Infrastruktur zu optimieren. Effizient gelingt das jedoch nur mit flexiblen Lösungen, die eine weitgehend automatisierte Verwaltung der Systeme aus der Ferne erlauben.

Schon der Ausfall eines einzigen Servers kann für ein Unternehmen weitreichende Folgen haben – schließlich stehen Geschäftsprozesse schnell still, wenn wichtige Anwendungen oder Daten nicht verfügbar sind. Die Folge: Frustrierte Mitarbeiter und Umsatzeinbußen sowie häufig auch verärgerte Kunden.

Dabei lassen sich viele Ausfälle mit einem vorausschauenden Systemmanagement durchaus vermeiden, allerdings fehlt IT-Abteilungen hierfür oft die Zeit, zumal problemlos laufende Systeme allzu gern unangetastet bleiben. Warum durch ein Update selbst Downtime verursachen, wenn doch alles funktioniert und andere Aufgaben priorisiert werden?

Diese Denkweise ist jedoch riskant, da Hardwaredefekte, Softwarefehler oder Cyberattacken keine Rücksicht auf Geschäftszeiten nehmen. Ausfälle können jederzeit auftreten und verursachen aufgrund der aufwändigen Fehlersuche und Wiederherstellungsarbeiten längere Downtimes und höhere Kosten als eine kontinuierliche Systempflege, die deutliche Vorteile bietet: Bei dieser lassen sich Software-Updates oder der Austausch von Hardwarekomponenten schon vorab ankündigen und in Zeitfenster verlegen, in denen möglichst wenige Anwender auf die Systeme angewiesen sind.

Der Schlüssel zum Erfolg für ein effizientes Systemmanagement sind Systeme, die sich remote und weitgehend automatisiert überwachen und steuern lassen. Schließlich stehen Server und Storage-Arrays üblicherweise in eigens gesicherten und klimatisierten Räumlichkeiten, oft an anderen oder Colocation-Standorten, sodass Administratoren nicht einfach für einen kurzen Statuscheck vorbeischauen können. Zudem handelt es sich bei den meisten Arbeiten um Routinetätigkeiten, die immer wieder durchgeführt werden müssen – manuell wäre das nicht nur viel zu aufwändig, sondern auch ermüdend und fehleranfällig.

Monitoring und Patching sind Pflicht Moderne IT-Systeme bieten in der Regel einen Remote-Zugriff, so dass es kaum Gründe gibt, sie im „Turnschuh-Modus“ direkt vor Ort zu verwalten. In Servern sitzt sogar fast immer ein eigener Fernwartungschip, aufgelötet auf das Mainboard oder auf einer separaten Steckkarte – der sogenannte Baseboard Management Controller (BMC). Er ermöglicht eine Überwachung und Steuerung des Systems aus der Ferne, ohne Agent oder spezielle Fernwartungssoftware. Auch dann, wenn der Server ausgeschaltet oder abgestürzt ist. Idealerweise bringt der BMC einen LAN-Port mit, damit Unternehmen das Systemmanagement über ein dediziertes Wartungsnetz durchführen können. Im Vergleich zum normalen Firmennetzwerk ist ein solches weniger anfällig für Angriffe, da es sich leichter abschotten lässt. Dennoch sollten Unternehmen nicht darauf verzichten, den Remote-Zugang zum Server selbst gut zu schützen, führt er doch direkt ins Herz des Systems. Ein guter BMC fügt sich in bestehende AD- und LDAP-Umgebungen ein und unterstützt eine Zwei-Faktor-Authentifizierung. Abbildung 1: Mit den richtigen Lösungen lassen sich Server und andere IT-Systeme komfortabel und zeitsparend remote verwalten. Über den BMC können Administratoren beispielsweise die Konfiguration des Servers anpassen oder ISO-Images als virtuelle Datenträger für eine Remote-Installation des Betriebssystems oder Updates einbinden. Auch Bugfixes und Sicherheits-Updates lassen sich leicht aus der Ferne installieren, um Systemausfälle infolge von Firmwarefehlern, Software-Bugs oder Angriffen auf bekannte Sicherheitslücken zu verhindern. Immerhin sind Softwareschwachstellen das beliebteste Einfallstor für Cyberkriminelle und kaum etwas öffnet diesen die Tür so weit wie Nachlässigkeiten beim Patching. Darüber hinaus sammelt der BMC die Statusdaten aller Hardwarekomponenten und stellt sie für externe Monitoring-Lösungen bereit. Mit deren Hilfe spüren Administratoren automatisiert ungewöhnliche Werte auf, die auf Hardwaredefekte oder andere Probleme hindeuten. So kündigen etwa steigende Fehlerraten einen baldigen Ausfall von Speichermedien an, während plötzliche Lastspitzen durch die Aktivitäten einer Ransomware oder Bugs in Anwendungen verursacht werden können. Ebenso erkennen Administratoren frühzeitig, wenn einzelne Komponenten den bestehenden Leistungsanforderungen nicht mehr gewachsen sind und können rechtzeitig ein Hardware-Upgrade planen. Das Monitoring trägt damit nicht nur zu einer hohen IT-Verfügbarkeit bei, indem es Ausfallzeiten minimiert, sondern schafft auch die Basis für eine gute System-Performance.

Integrationen sparen Zeit In der Regel stellen die Hersteller von Infrastruktursystemen ihren Lösungen vielseitige Management-Tools zur Seite, die optimal auf die jeweiligen Systeme abgestimmt und daher einfach zu nutzen sind. Die Tools bringen eigentlich alles mit, was man für ein umfassendes Systemmanagement benötigt, unterstützen allerdings nur die Systeme des jeweiligen Anbieters. Um in heterogenen IT-Umgebungen nicht regelmäßig zwischen verschiedenen Tools hin und her wechseln zu müssen, benötigen Unternehmen ergänzende Lösungen. Früher waren das oft mächtige, aber auch sehr komplexe Management-Frameworks, heute kommen eher individuelle Tool-Sets zum Einsatz, die einfacher zu handhaben sind und sich besser auf die eigenen Anforderungen zuschneiden lassen. In vielen Unternehmen hat sich beispielsweise Nagios für das Monitoring bewährt, während Ansible bei Deployment und Konfiguration sowie der Orchestrierung der Systeme beliebt ist. Die Tools der Server-Anbieter arbeiten mit diesen Lösungen dank offener Standards und Schnittstellen ebenso reibungslos zusammen wie mit VMware vCenter und Microsoft Windows Admin Center. Die Integration in die Managementlösungen von VMware und Microsoft spart Administratoren viel Zeit, weil sie hardwarenahe IT-Verwaltungsaufgaben sowie das Management von Betriebssystemen und virtuellen Umgebungen über eine zentrale Oberfläche erledigen können. Auch der parallele Roll-out von Firmware- und Betriebssystem-Updates ist möglich, und das sogar in Clustern, ohne dass Anwendungen oder Services offline gehen. Schließlich werden alle Knoten nacheinander aktualisiert und virtuelle Maschinen automatisch auf verfügbare Knoten verschoben. Optimal ist es, wenn sich die herstellereigenen Tools durch Plug-ins erweitern lassen und sich in weiterführende Lösungen wie ein IT-Service-Management einklinken. So kann bei Problemen automatisch ein Ticket generiert und etwa der Austausch einer ausfallbedrohten Komponente initiiert werden. Solche dokumentierten und automatisierten Abläufe sind insbesondere für die IT-Verfügbarkeit in Außenstellen und Niederlassungen ohne dediziertes IT-Personal wichtig.