So erstellen Sie eine Performance-Baseline für das Netzwerk-Monitoring

IT-Überwachung ist mit einer Performance Baseline einfacher, da sie die IT-Kennzahlen im Normalbetrieb zeigt. Jede Änderung ist schnell zu erkennen.

Warum braucht man eine Performance-Baseline?

Sehr einfach ausgedrückt, ist eine Performance-Baseline ein Satz von Kennzahlen für die Überwachung der Netzwerk-Performance, der die normalen Betriebsbedingungen in der Netzwerk-Infrastruktur eines Unternehmens wiedergibt. Mit Hilfe der Baseline können Techniker Veränderungen erkennen, die auf mögliche Probleme hinweisen.

Das Erstellen einer Netzwerk-Baseline liefert zugleich frühe Hinweise, falls die Anforderungen an Anwendungen und Netzwerke diese nah an ihre Kapazitätsgrenze bringen – das Netzwerk-Team gewinnt somit Zeit, um Erweiterungen zu planen. Der Abgleich von Performance-Baselines mit Dienstgüte-Vereinbarungen (service-level agreements – SLAs) für das Netzwerk kann der IT-Abteilung zudem dabei helfen, innerhalb ihrer Kapazitätsparameter zu bleiben und Problembereiche zu erkennen, die nicht den Vorgaben entsprechen.

Die Herausforderung dabei für Netzwerk-Techniker: Definieren, was für die Infrastruktur ihrer Organisation als normal anzusehen ist.

Kein Branchen-Standard für Netzwerk-Überwachung oder Kennzahlen

Für IT-Anwender, die für Best Practices das Rahmenwerk Information Technology Infrastructure Library (ITIL) übernommen haben, stehen ITIL-spezifische Werkzeuge zur Netzwerk-Überwachung zur Verfügung. Diese Werkzeuge nutzen die Vorteile der dann vorhandenen Datenbanken zur Geräte-Konfiguration und Anwendungen zur Unterstützung der Management-Prozesse für IT-Dienste. Abgesehen von ITIL gibt es jedoch keinen Branchen-Standard für das Festlegen von Performance-Baselines. In welchem Umfang unterschiedliche Monitoring-Werkzeuge unterstützt werden und wie tiefe und breite Informationen zur Verfügung stehen, hängt in hohem Maß von Herstellern, Geräten und Betriebssystemen ab. Dies verhindert, dass beim Monitoring ein einheitlicher Satz von Kennzahlen verwendet werden kann.

Ein guter Ausgangspunkt können die Anbieter von Netzwerk-Technik selbst sein. Jeder von ihnen müsste zumindest eine Liste der Monitoring-Produkte haben, die ihre Geräte unterstützen. Angesichts der Allgegenwart von Monitoring-Protokollen wie SNMP bieten viele Anbieter zudem eigene Empfehlungen oder Best Practices für das Monitoring und definieren Grenzwerte für ihre Produkte. Mit Hilfe dieser Informationen können Administratoren zunächst nur einen kleinen Teil der verfügbaren Daten verwenden und bei Bedarf weitere dazu nehmen. Cisco zum Beispiel empfiehlt, bei seinen Routern eine CPU-Auslastung von 60 Prozent nicht zu überschreiten, und hat eine SNMP-Nachricht definiert, die diese Kennzahl überwacht.

Monitoring der Netzwerk-Performance: Bei der Bestandsaufnahme an Virtualisierung denken

Wenn Sie zusammenstellen, welche Netzwerk-Geräte Sie überwachen wollen, sollten Sie dabei sowohl physische als auch virtuelle Geräte berücksichtigen. Angesichts des anhaltenden Trends zur Virtualisierung von Appliances und Servern können virtuelle Switches (vSwitches) und virtualisierte Anwendungsbeschleuniger eine wichtige Rolle für die Beurteilung der Netzwerk-Performance spielen. VSwitches dienen als Netzwerk-Ports in einer Umgebung und lassen virtuelle Maschinen untereinander kommunizieren, ohne dass dabei physische Netzwerk-Adapter passiert werden. Damit beschleunigen sie zwar die Kommunikation zwischen Servern, geben Werkzeugen für Netzwerk-Monitoring aber keine Möglichkeit, über die Daten-Pfade zu berichten oder Performance-Daten von Anwendungen zu bekommen.

Zum Glück hat die Netzwerk-Branche dieses Problem erkannt und arbeitet an Abhilfe, entweder über intelligentere vSwitches oder durch Standards für virtuelle Server wie Virtual Ethernet Port Aggregator (VEPA). Darüber kann auch virtualisierter Datenverkehr für gewöhnliche Monitoring-Werkzeuge erfassbar gemacht werden.

Daten sammeln für die Festlegen einer Performance-Baseline für das Netzwerk

Nach der Inventarisierung der Netzwerk-Geräte besteht die nächste Phase darin, den über die Infrastruktur laufenden Datenverkehr zu analysieren. Schon ein Gesamtwert für die Netzwerk-Auslastung ist ein hilfreicher Indikator für die Gesamtgesundheit des Netzwerks. Doch er bietet keine Anhaltspunkte dafür, wie das Netzwerk konkret genutzt wird. Um auch diese zu bekommen, müssen Monitoring-Werkzeuge echte Daten-Pakete sammeln und öffnen.

Für das Sammeln von Netzwerk-Daten zur Traffic-Analyse gibt es zwei Möglichkeiten, die beide ihre Stärken und Schwächen haben. Werkzeuge zur Paket-Erfassung (Sniffing-Tools) erfassen den gesamten Strom an Netzwerk-Daten, so dass Administratoren einen vollen Blick darauf bekommen, was sich zu einer bestimmten Zeit in ihrem Netzwerk tut. Für forensische Analysen und Problembehandlung kann das unverzichtbar sein, für laufendes Monitoring und Baseline-Analysen jedoch ist es vielleicht übertrieben. In diesem Zusammenhang kommt es vor allem auf Kennzahlen zur Auslastung von Anwendungen und Netzwerk an, nicht unbedingt auf die Inhalte einzelner Pakete. Auch in solchen Fällen können Sniffing-Tools die benötigten Informationen liefern, dies aber mit einem erheblichen Overhead.

Proben nehmen mit sFlow/NetFlow

Alternativ dazu gibt es Protokolle wie NetFlow oder sFlow, die Datenverkehr nur zu festgelegten Zeiten mitschneiden und damit weniger Storage-Last mit sich bringen. Eingebaut in viele Enterprise-Router, können NetFlow und seine Varianten Daten-Stichproben mit deutlich weniger Overhead als bei Sniffern erheben. Diese liefern einen nützlichen Überblick darüber, welche Anwendungen im Netzwerk laufen. Durch Paket-Analysen können Administratoren zudem Trends bei der Nutzung von Anwendungen erkennen und für jede Anwendung einen Normalwert für ihren Anteil an der gesamten Netzwerk-Nutzung bestimmen.

Für tiefere Analysen können die meisten Werkzeuge zudem dabei helfen, Internet-Verkehr zu filtern, um beispielsweise zwischen Cloud-basierten Anwendungen und allgemeinem Web-Surfen zu unterscheiden. Zu wissen, wie viel Netzwerk-Kapazität jede einzelne Anwendung beansprucht, ist nützlich bei der Suche nach Ursachen für lange Antwortzeiten. Zugleich können Netzwerk-Administratoren so besser erkennen, welche Folgen neue Anwendungen und Dienste haben, die sie in ihren Netzen einrichten.

Wie lange müssen Sie Netzwerk-Daten für eine Performance-Baseline sammeln?

Wenn Sie alle zu überwachenden Daten definiert haben, können Sie sich daran machen, sie zu erfassen. Viele Experten nennen als effektives Monitoring-Fenster einen Zeitraum von sieben Tagen, weil sich dann auch schon Trends erkennen lassen.

Wichtig dabei ist, den zeitlichen Kontext der Datenverkehr-Erfassung zu kennen. In den meisten Organisationen gibt es zyklische Nutzungsmuster, was auch bei Traffic-Analysen beachtet werden muss. Bei einem großen Einzelhändler zum Beispiel wird es sicherlich Spitzen bei Netzwerk- und Anwendungsnutzung in der Vorweihnachtszeit geben, bei einem Produktionsbetrieb könnte aufgrund der Ferienzeit genau der gegenteilige Effekt auftreten. Wenn solche geschäftlichen Zyklen bei der Analyse außer Acht gelassen werden, können die Ergebnisse der Baseline-Erstellung nach oben wie unten deutlich von der Realität abweichen.

Wenn es zu hohen Spitzen oder tiefen Tälern bei den erfassten Daten kommt, muss festgestellt werden, was der Grund dafür ist und ob dies noch als Normalfall für das Netzwerk anzusehen ist. Wenn die Spitzen durch ein später identifiziertes Problem entstanden sind, sollten Sie die Baseline nur anhand der übrigen Datenpunkte erstellen. Wenn die Spitzen dagegen regelmäßig auftreten, können Sie sie in den Durchschnitt mit aufnehmen. Denkbar ist auch, dass in Ihrem Netzwerk während des Überwachungslaufs ein bedeutendes Problem vorlag. In solchen Fällen sollten Sie die gesammelten Daten einfach verwerfen und die Kennzahlen noch einmal erfassen, nachdem das Problem gelöst wurde.

Wenn Sie genügend Monitoring-Daten gesammelt und Ausreißer beseitigt haben, können Sie eine Baseline für jede Kennzahl bestimmen. Das Ergebnis davon ist eine typische Bandbreite für die einzelnen von Ihnen definierten Punkte, die dann zusammengenommen die aktuelle Performance-Baseline für Ihr Netzwerk ergeben.

Als letzten Punkt müssen Sie dabei beachten, dass die heute festgelegten Baselines nur so lange von Nutzen sind, bis sich etwas ändert. Neues Netzwerk-Equipment, neue Server oder neue Anwendungen haben einen Einfluss auf die Baseline, so dass die Monitoring-Lösung laufend gepflegt und mit neuen Daten gefüttert werden muss. Die gute Nachricht dabei: In den meisten Fällen ändert sich nicht alles auf einmal, also reicht es meistens aus, beim Hinzufügen von Anwendungen, Diensten oder Geräten kleinere Neu-Einstellungen vorzunehmen.

Artikel wurde zuletzt im Juli 2010 aktualisiert

Erfahren Sie mehr über Netzwerk- und Anwendungs-Performance

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close