alphaspirit - stock.adobe.com

Wichtige Komponenten und Tools der Serverüberwachung

Für die Verwaltung von Serverkapazität müssen Administratoren viele Komponenten und Tools implementieren. Die richtigen Workflows verbinden sie zu einer kohärenten Strategie.

Die Serververwaltung ist ein wesentlicher Bestandteil des Betriebs eines Rechenzentrums. Die Wahl des richtigen Tools für diese Aufgabe und die Auswahl der zu überwachenden Komponenten ist ebenfalls von entscheidender Bedeutung.

Wie Sie die Serverüberwachung angehen, hängt davon ab, was Sie im Auge behalten müssen, von der Art der Infrastruktur und der Art der Umgebung. Bei der Wahl des richtigen Überwachungs-Tools müssen Sie auch die Dynamik des Rechenzentrums und die Arbeitslast berücksichtigen, die es bewältigen muss. In manchen Situationen kann eine Standardoption gut funktionieren, während Sie in anderen Situationen vielleicht ein maßgeschneidertes Tool benötigen.

Informieren Sie sich über die wichtigsten Serverkomponenten und einige der Tools, die Sie verwenden können.

Zu überwachende Serverkomponenten

Die Überwachung von physischen und Software-Servicekomponenten kann bei der Fehlersuche helfen und mögliche Änderungen der Verarbeitungsanforderungen vorhersagen.

CPU

Da CPUs grundlegende Logik- und E/A-Operationen (Eingang/Ausgang) sowie Routing-Befehle für andere Komponenten im Server verarbeiten, sind sie immer in Gebrauch. Eine hohe Prozessorauslastung kann auf ein Problem mit der CPU selbst hinweisen, aber wahrscheinlicher ist ein Zeichen für Probleme mit angeschlossenen Komponenten. Bei über 70 Prozent Auslastung können Anwendungen auf dem Server träge werden oder nicht mehr reagieren.

Memory

Eine hohe Speichernutzung kann durch ein gleichzeitiges Ausführen mehrerer Anwendungen entstehen, aber es kann ebenso sein, dass ein eigentlich nicht ressourcenintensiver Prozess den Bedarf durch einen Fehler sprunghaft ansteigen lässt. Die Hardwarekomponente selbst fällt selten aus, Admins sollten ihre Leistung überprüfen, wenn die Auslastung steigt.

Storage Area Network

SAN-Komponentenprobleme können an mehreren Stellen auftreten, einschließlich der Verkabelung, Host-Bus-Adapter, Switches und der Speicherserver selbst. Ein einziger SAN-Server kann Daten für mehrere Anwendungen hosten und erstreckt sich oft über mehrere physische Standorte. Fällt er aus, sind erhebliche Einschränkungen im Geschäftsbetrieb die Folge.

Festplattenkapazität des Servers

Festplatten tragen dazu bei, Speicherprobleme zu lindern und Engpässe bei der Datenspeicherung zu reduzieren. Probleme können entstehen, wenn mehr Benutzer auf dieselbe Anwendung zugreifen, die einen bestimmten Speicherort verwendet, oder wenn sich ein ressourcenintensiver Prozess auf einem Server befindet, der nicht für diesen Betrieb ausgelegt ist. Kann man die Plattenkapazität nicht erhöhen, sollten Administratoren die Nutzungsspitzen beobachten und dann entsprechend umverteilen, um das in Zukunft zu vermeiden.

Speicher-E/A-Raten

Administratoren sollten auch die In- und Output-Raten bei Speichern überwachen. Engpässe und hohe Raten können auf eine Vielzahl von Problemen hinweisen, zum Beispiel Probleme mit dem CPU, Einschränkungen der Plattenkapazität, Prozessfehler und Hardwareausfälle.

Temperatur

Eine weitere wichtige Messgröße ist die Servertemperatur. Zu hohe Temperaturen sind schädlich für die Hardware und können aus verschiedenen Gründen entstehen: ein Ausfall der Klimaanlage, interner Serverhardware-Ausfall (CPU, RAM oder Hauptplatine), externer Hardwareausfall (Switches und Verkabelung) oder ein Softwarefehler (Firmware-Fehler oder Probleme mit Anwendungsprozessen).

Betriebssystem, Firmware und Serveranwendungen

Der gesamte Server-Stack muss zusammenwirken, um eine optimale Nutzung zu gewährleisten (Basis-E/A-System, Betriebssystem, Hypervisor, Treiber und Anwendungen). Gescheiterte Updates können zu Problemen für den Server, gehostete Anwendungen, schlechter User Experience (UX) oder Ausfallzeiten führen.

Unverzichtbare Server-Überwachungs-Tools

Viele Serverüberwachungs-Tools sind als eigenständige Produkte oder als Teil einer größeren Software zur Infrastrukturüberwachung erhältlich. Im Folgenden stellen wir fünf Überwachungs-Tools und -Softwares vor, die Sie in Betracht ziehen sollten.

1. SolarWinds Server & Application Monitor

SolarWinds Server & Application Monitor (SAM) ist eine Software, die Überwachungs-, Optimierungs- und Diagnose-Tools in einem webbasierten Hub für Unternehmen oder große Rechenzentren bereitstellt. Mit dieser Software können Sie schnell erkennen, welche Serverressourcen in Echtzeit ausgelastet sind, historische Berichte nutzen, um Trends zu verfolgen und den Kauf von Ressourcen vorauszusagen. SAM ermöglicht Unternehmen die Überwachung von On-Premises-, Cloud- oder Hybrid-App-Umgebungen und -Infrastrukturen.

Zu den wichtigsten Funktionen gehören die folgenden:

  • umfassende Überwachung von Microsoft-Azure- und AWS-Anwendungen, Systemen, Hypervisoren sowie IaaS-, PaaS- und SaaS-Produkten, einschließlich Container-Überwachung und API-Polling
  • mehr als 1.200 vorkonfigurierte Überwachungsvorlagen und anpassbare Vorlagen für Ihre Umgebung
  • Do-it-yourself-Bereitstellung durch Kunden, die in etwa einer Stunde mit der Überwachung beginnen können

Die Lizenzierung für alle SolarWinds-Produkte erfolgt je nach Produkt auf Dauer oder im Abonnement. Für SAM ist die Lizenzierung entweder knotenbasiert oder komponentenbasiert. Node-Tier-Lizenzen reichen von 10 bis 5.000 Nodes. Bei der komponentenbasierten Lizenzierung wird die Anzahl der Komponenten, Knoten, Volumes und zugewiesenen Komponentenmonitore gezählt, um einen Preis zu ermitteln. Für jeden Komponentenmonitor wird eine Lizenz benötigt, und die Lizenztypen sind in verschiedenen Größen erhältlich. Die kleinste ist für 150 Komponenten, die größte ist unbegrenzt.

SolarWinds SAM kann 30 Tage lang kostenlos getestet werden.

2. Nagios XI

Nagios XI ist eine erweiterte Schnittstelle der Open-Source-Überwachungssoftware Nagios. Sie ist durch ihre Kernplattform und Add-ons von Drittanbietern in hohem Maße anpassbar. Die Dashboards von Nagios XI bieten Vorhersage- und Trenddaten für die proaktive Wartung und Fehlerbehebung von Servern, die über eine Weboberfläche zugänglich sind.

Zu den Hauptmerkmalen gehören die folgenden:

  • skalierbare Kernüberwachungssoftware
  • automatisierte Visualisierungen zur Kapazitätsplanung
  • Bulk-Server-Management-Tools wie Bulk Host Import, Mass Acknowledgement und Auto-Discovery

Nagios XI hat zwei Editionen für Unternehmenskunden: Standard und Enterprise. Kunden der Enterprise-Edition müssen zusätzlich einen jährlichen Wartungs- und Support-Plan erwerben.

Nagios XI kann 30 Tage lang kostenlos getestet werden.

3. Paessler PRTG

PRTG ist eine Software, die sowohl On-Premises als auch in der Cloud Server überwachen kann – von KMUs, die nur eine Handvoll Server überwachen wollen, bis hin zu großen Unternehmen und Rechenzentren.

Zu den wichtigsten Funktionen gehören folgende:

  • Überwachung von Hardware, Software, Datenverkehr, Diensten, LAN, WAN und Servern
  • einfache Bereitstellung und Netzwerkanerkennung durch ein automatisiertes Tool
  • anpassbare Netzwerkvisualisierungen und -warnungen
  • zentralisierte Plattform zur Überwachung von Netzwerken beliebiger Größe über ein Webinterface und eine mobile App

PRTG ist in verschiedenen Editionen und Preisklassen erhältlich. PRTG Network Monitor eignet sich für kleine und mittelgroße Infrastrukturen mit bis zu 1.000 Geräten und Diensten. PRTG Enterprise Monitor ist für Infrastrukturumgebungen mit Tausenden von Geräten und Diensten gedacht.

Paessler PRTG bietet eine kostenlose 30-tägige Testphase an.

4. Datadog Infrastructure Monitoring

Die Serverüberwachung ist in der Infrastruktur-Überwachungssoftware von Datadog enthalten. Sie bietet schlüsselfertige Integrationen für Ihren gesamten Tech-Stack, von lokalen bis zu Cloud-Servern und SaaS- und Cloud-Anwendungen bis zu Datenbanken. Es zentralisiert die Serverüberwachung, so dass Teams den Datenverkehr in ihren Netzwerken visualisieren und individuelle Warnungen für kritische Probleme erhalten können.

Zu den wichtigsten Funktionen gehören die folgenden:

  • mehr als 650 Integrationen, darunter KI- und Machine-Learning-Tools, Cloud-Apps, Container, IoT und Netzwerkknoten
  • End-to-End-Anwendungsüberwachung und Fehlerbehebung
  • automatisierte Protokollerfassung für einfache Durchsuchbarkeit und Visualisierung
  • Dashboards, die die UX zusammenfassen und dabei helfen, Ihren Tech-Stack mit den geschäftlichen Auswirkungen in Einklang zu bringen

Datadog bietet vier Optionen für sein Infrastrukturmanagement-Tool an. Die Preise werden pro Host und Monat ermittelt. Datadog bietet über sein Vertriebsteam Mengenrabatte für mehr als 500 Hosts pro Monat an.

Datadog offeriert eine kostenlose Testversion für alle vier Preisstufen an.

5. Splunk Observability Cloud

Splunk Observability Cloud bietet Echtzeit-Überwachung und -Warnungen, gezielte Fehlerbehebung und zentralisierte Unternehmenskontrollen für große Umgebungen. Sie können diese Software in hybriden Umgebungen verwenden, die Cloud- und On-Premises-Infrastrukturen kombinieren.

Zu den wichtigsten Funktionen gehören die folgenden:

  • mehr als 250 Cloud-Service-Integrationen und vorgefertigte Dashboards
  • Tracking für benutzerdefinierte Metriken über IT- und Geschäfts-KPIs hinweg
  • sofortige und erweiterte Kubernetes-Container-Überwachung
  • adaptive Alarmbedingungen zur Reduzierung von Alarmstürmen

Splunk Observability Cloud kann 14 Tage lang kostenlos getestet werden.

Anmerkung: Diese Liste wurde auf der Grundlage individueller Recherchen von Softwareplattformen für die Infrastrukturüberwachung nach Informationen über Abonnementangebote und -dienste zusammengestellt.

Erfahren Sie mehr über Data-Center-Betrieb

ComputerWeekly.de
Close