Wichtige Komponenten und Tools für die Serverüberwachung
Für die Verwaltung von Serverkapazität müssen Administratoren viele Komponenten und Tools implementieren. Die richtigen Workflows verbinden sie zu einer kohärenten Strategie.
Obwohl die Verwaltung der Serverkapazitäten ein wesentlicher Bestandteil des Betriebs von Rechenzentren ist, herrscht bezüglich der zu überwachenden Komponenten und der dafür notwendigen Tools oft Ungewissheit. Die Vorgehensweise bei der Serverüberwachung kann sich je nach Art der Infrastruktur im Rechenzentrum unterscheiden, besonders zwischen virtuellen Strukturen und solchen auf physischen Geräten.
Mit den heute verfügbaren Tools zur Kapazitätsverwaltung können Administratoren ihre Server in Echtzeit beobachten und optimieren. Überwachungs-Tools halten sie über die Ressourcennutzung auf dem Laufenden und weisen automatisch Ressourcen zu, um eine kontinuierliche Systemverfügbarkeit zu gewährleisten.
Für eine ganzheitliche Sicht auf die Infrastruktur sollte eine Kapazitätsmanagementsoftware diese Serverkomponenten überwachen. Die gewonnenen Informationen helfen Administratoren bei der Fehlerbehebung und der Einschätzung, ob zukünftige Anpassungen aufgrund von Anforderungsänderungen notwendig sind.
CPU: Da CPUs grundlegende Logik- und E/A-Operationen (Eingang/Ausgang) sowie Routing-Befehle für andere Komponenten im Server verarbeiten, sind sie immer in Gebrauch. Eine hohe Prozessorauslastung kann auf ein Problem mit der CPU selbst hinweisen, aber wahrscheinlicher ist ein Zeichen für Probleme mit angeschlossenen Komponenten. Bei über 70 Prozent Auslastung können Anwendungen auf dem Server träge werden oder nicht mehr reagieren.
Speicher: Eine hohe Speichernutzung kann durch ein gleichzeitiges Ausführen mehrerer Anwendungen entstehen, aber es kann ebenso sein, dass ein eigentlich nicht ressourcenintensiver Prozess den Bedarf durch einen Fehler sprunghaft ansteigen lässt. Die Hardwarekomponente selbst fällt selten aus, Admins sollten ihre Leistung überprüfen, wenn die Auslastung steigt.
Storage Area Network:SAN-Komponentenprobleme können an mehreren Stellen auftreten, einschließlich der Verkabelung, Host-Bus-Adapter, Switches und der Speicherserver selbst. Ein einziger SAN-Server kann Daten für mehrere Anwendungen hosten und erstreckt sich oft über mehrere physische Standorte. Fällt er aus, sind erhebliche Einschränkungen im Geschäftsbetrieb die Folge.
Festplattenkapazität des Servers. Festplatten tragen dazu bei, Speicherprobleme zu lindern und Engpässe bei der Datenspeicherung zu reduzieren. Probleme können entstehen, wenn mehr Benutzer auf dieselbe Anwendung zugreifen, die einen bestimmten Speicherort verwendet, oder wenn sich ein ressourcenintensiver Prozess auf einem Server befindet, der nicht für so einen Betrieb ausgelegt ist. Kann man die Plattenkapazität nicht erhöhen, sollten Administratoren die Nutzungsspitzen beobachten und dann entsprechend umverteilen, um dies in Zukunft zu vermeiden.
Speicher-E/A-Raten. Administratoren sollten auch die In- und Output-Raten bei Speichern überwachen. Engpässe und hohe Raten können auf eine Vielzahl von Problemen hinweisen, zum Beispiel Probleme mit dem CPU, Einschränkungen der Plattenkapazität, Prozessfehler und Hardwareausfälle.
Temperatur. Eine weitere wichtige Messgröße, die man überwachen sollte, ist die Servertemperatur. Zu hohe Temperaturen sind schädlich für die Hardware und können aus verschiedenen Gründen entstehen: ein Ausfall der Klimaanlage, interner Serverhardware-Ausfall (CPU, RAM oder Hauptplatine), externer Hardwareausfall (Switches und Verkabelung) oder ein Softwarefehler (Firmware-Fehler oder Probleme mit Anwendungsprozessen).
Betriebssystem, Firmware und Serveranwendungen. Der gesamte Server-Stack muss zusammenwirken, um eine optimale Nutzung zu gewährleisten (Basis-E/A-System, Betriebssystem, Hypervisor, Treiber und Anwendungen.) Gescheiterte Updates können zu Problemen für den Server, gehostete Anwendungen, schlechter User Experience (UX) oder Ausfallzeiten führen.
Berichte durch Tools sinnvoll auswerten
Die meisten Server-Überwachungsprogramme verfolgen alle Probleme über den Technologie-Stack der Rechenzentrumsinfrastruktur hinweg und erstatten Bericht. Dazu gehören standardmäßige und benutzerdefinierte Komponentenüberwachung, automatische und manuelle Optimierungsfunktionen sowie standardmäßige und benutzerdefinierte Benachrichtigungsoptionen.
Der Softwaresektor für die Serverüberwachung deckt alle Arten von Architekturen sowie die erforderliche Tiefe und Breite der Datenerfassung ab. Wir haben im Folgenden eine Sammlung von Software für die Überwachung der Serverkapazität zusammengestellt.
SolarWinds Server & Application Monitor
Die Software von SolarWinds bietet Überwachungs-, Optimierungs- und Diagnosewerkzeuge in einem zentralen Hub. Anwender können schnell und in Echtzeit erkennen, welche Serverressourcen ausgelastet sind, historische Berichte zur Verfolgung von Trends verwenden und prognostizieren, wie sich der Ressourcenbedarf entwickelt. Mit zusätzlichen Funktionen können Administratoren Engpässe bei der virtuellen und physischen Speicherkapazität diagnostizieren und beheben, die den Zustand und die Leistung von Anwendungen beeinträchtigen.
Die meisten Server-Überwachungs-Programme verfolgen alle Probleme über den Technologie-Stack der Rechenzentrums-Infrastruktur hinweg und erstatten Bericht.
HelpSystems Vityl Capacity Management
Vityl Capacity Management ist ein umfassendes Kapazitätsmanagementprogramm, das es Unternehmen leicht macht, die Leistung proaktiv zu verwalten und die Kapazitätsplanung in hybriden Strukturen durchzuführen. Es bietet Echtzeitüberwachungsdaten und historische Trendberichte, die dabei helfen, den Zustand und die Leistung des Netzwerks im Laufe der Zeit zu verstehen.
BMC Software TrueSight Capacity Optimization
Das Produkt TrueSight Capacity Optimization unterstützt Administratoren durch Echtzeit- und predictive Analytics (prädiktive Analyse) bei der Planung, Verwaltung und Optimierung von On-Premises und Cloud- Ressourcen. Es bietet Einblicke in verschiedene Netzwerktypen (physisch, virtuell oder Cloud) und unterstützt bei der Verwaltung und Prognose der Servernutzung.
VMware Capacity Planner
Als Planungs-Tool kann der Capacity Planner von VMware Daten über den Zustand der Server sammeln und analysieren und die zukünftige Nutzung besser vorhersagen. Die Prognosefunktion bietet Einblicke in Trends bei der Kapazitätsnutzung sowie Virtualisierungs-Benchmarks auf der Grundlage von Branchenleistungsstandards.
Splunk App for Infrastructure
Die Splunk App for Infrastructure (SAI) ist ein All-in-One-Tool, das mit rationalisierten Arbeitsabläufen und fortschrittlichen Warnmeldungen alle Netzwerkkomponenten überwacht. Mit SAI können Administratoren benutzerdefinierte Visualisierungen und Warnmeldungen für eine bessere Echtzeitüberwachung und -Berichterstattung durch metrische Gruppierung und Filterung auf der Grundlage ihres Rechenzentrums und ihrer Berichtsanforderungen erstellen.