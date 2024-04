Die Serververwaltung ist ein wesentlicher Bestandteil des Betriebs eines Rechenzentrums. Die Wahl des richtigen Tools für diese Aufgabe und die Auswahl der zu überwachenden Komponenten ist ebenfalls von entscheidender Bedeutung.

Wie Sie die Serverüberwachung angehen, hängt davon ab, was Sie im Auge behalten müssen, von der Art der Infrastruktur und der Art der Umgebung. Bei der Wahl des richtigen Überwachungs-Tools müssen Sie auch die Dynamik des Rechenzentrums und die Arbeitslast berücksichtigen, die es bewältigen muss. In manchen Situationen kann eine Standardoption gut funktionieren, während Sie in anderen Situationen vielleicht ein maßgeschneidertes Tool benötigen.

Informieren Sie sich über die wichtigsten Serverkomponenten und einige der Tools, die Sie verwenden können.

Zu überwachende Serverkomponenten Die Überwachung von physischen und Software-Servicekomponenten kann bei der Fehlersuche helfen und mögliche Änderungen der Verarbeitungsanforderungen vorhersagen. CPU Da CPUs grundlegende Logik- und E/A-Operationen (Eingang/Ausgang) sowie Routing-Befehle für andere Komponenten im Server verarbeiten, sind sie immer in Gebrauch. Eine hohe Prozessorauslastung kann auf ein Problem mit der CPU selbst hinweisen, aber wahrscheinlicher ist ein Zeichen für Probleme mit angeschlossenen Komponenten. Bei über 70 Prozent Auslastung können Anwendungen auf dem Server träge werden oder nicht mehr reagieren. Memory Eine hohe Speichernutzung kann durch ein gleichzeitiges Ausführen mehrerer Anwendungen entstehen, aber es kann ebenso sein, dass ein eigentlich nicht ressourcenintensiver Prozess den Bedarf durch einen Fehler sprunghaft ansteigen lässt. Die Hardwarekomponente selbst fällt selten aus, Admins sollten ihre Leistung überprüfen, wenn die Auslastung steigt. Storage Area Network SAN-Komponentenprobleme können an mehreren Stellen auftreten, einschließlich der Verkabelung, Host-Bus-Adapter, Switches und der Speicherserver selbst. Ein einziger SAN-Server kann Daten für mehrere Anwendungen hosten und erstreckt sich oft über mehrere physische Standorte. Fällt er aus, sind erhebliche Einschränkungen im Geschäftsbetrieb die Folge. Festplattenkapazität des Servers Festplatten tragen dazu bei, Speicherprobleme zu lindern und Engpässe bei der Datenspeicherung zu reduzieren. Probleme können entstehen, wenn mehr Benutzer auf dieselbe Anwendung zugreifen, die einen bestimmten Speicherort verwendet, oder wenn sich ein ressourcenintensiver Prozess auf einem Server befindet, der nicht für diesen Betrieb ausgelegt ist. Kann man die Plattenkapazität nicht erhöhen, sollten Administratoren die Nutzungsspitzen beobachten und dann entsprechend umverteilen, um das in Zukunft zu vermeiden. Speicher-E/A-Raten Administratoren sollten auch die In- und Output-Raten bei Speichern überwachen. Engpässe und hohe Raten können auf eine Vielzahl von Problemen hinweisen, zum Beispiel Probleme mit dem CPU, Einschränkungen der Plattenkapazität, Prozessfehler und Hardwareausfälle. Temperatur Eine weitere wichtige Messgröße ist die Servertemperatur. Zu hohe Temperaturen sind schädlich für die Hardware und können aus verschiedenen Gründen entstehen: ein Ausfall der Klimaanlage, interner Serverhardware-Ausfall (CPU, RAM oder Hauptplatine), externer Hardwareausfall (Switches und Verkabelung) oder ein Softwarefehler (Firmware-Fehler oder Probleme mit Anwendungsprozessen). Betriebssystem, Firmware und Serveranwendungen Der gesamte Server-Stack muss zusammenwirken, um eine optimale Nutzung zu gewährleisten (Basis-E/A-System, Betriebssystem, Hypervisor, Treiber und Anwendungen). Gescheiterte Updates können zu Problemen für den Server, gehostete Anwendungen, schlechter User Experience (UX) oder Ausfallzeiten führen.