Definition

Netzwerk-Monitoring

Was ist Netzwerk-Monitoring?

Unter Netzwerk-Monitoring, häufig auch als Netzwerkmanagement bezeichnet, versteht man die fortlaufende Überwachung eines Computernetzwerks auf Fehler oder Schwachpunkte, um eine konstante Netzwerk-Performance zu gewährleisten. Technisch gesehen kann man Netzwerk-Monitoring als Teilbereich des Netzwerkmanagements betrachten, in der Praxis werden die beiden jedoch als gleichwertig angesehen.

Netzwerk-Monitoring erfasst eine Reihe von Daten aus einem Computernetzwerk und wertet sie aus. Die Daten stammen unter anderem von Routern, Switches, Firewalls, Load Balancern und sogar Endpunkten wie Servern und Arbeitsplatzrechnern. Die gesammelten Daten werden gefiltert und analysiert, um eine Vielzahl von Netzwerkproblemen zu identifizieren. Zu diesen Netzwerkproblemen gehören:

  • Gerätefehler
  • Verbindungsausfälle
  • Schnittstellenfehler
  • Paketverlust
  • Reaktionszeit der Anwendung
  • Konfigurationsänderungen

Die Funktionen eines Systems für Netzwerk-Monitoring und Netzwerkmanagement lassen sich in mehrere Kategorien unterteilen, von denen jede eine bestimmte Funktion erfüllt.

Folgend finden Sie eine von NetCraftsmen entwickelte Referenzarchitektur für das Netzwerkmanagement. Diese zeigt die verschiedenen Kategorien der Datenerfassung, wie sie Daten gemeinsam nutzen und die verwendeten Protokolle.

Diese Referenzarchitektur veranschaulicht die Elemente von Netzwerk-Monitoring und die dazugehörigen Protokolle.
Abbildung 1: Diese Referenzarchitektur veranschaulicht die Elemente von Netzwerk-Monitoring und die dazugehörigen Protokolle.

Ereigniserfassung und -verarbeitung

Die Ereigniserfassung basiert auf SNMP-Traps (Simple Network Management Protocol) und Syslog, um Daten zu Netzwerkereignissen zu ermitteln. Ereignisse ermöglichen es dem Netzwerk, Administratoren über wichtige Ereignisse zu informieren, ohne Netzwerkgeräte abfragen zu müssen. Mithilfe der Ereignisverarbeitung lassen sich kritische Ereignisse identifizieren, wodurch die Anzahl der Alarme reduziert wird, um die sich die Netzwerkadministratoren kümmern müssen.

Network Change and Configuration Management

Network Change and Configuration Management (NCCM) archiviert Konfigurationen von Netzwerkgeräten und kann zur Automatisierung von Konfigurations-Updates verwendet werden. Konfigurationen können über verschiedene Mechanismen abgerufen und aktualisiert werden, etwa per Befehlszeile (Command-line Interface, CLI), SNMP, RESTCONF und NETCONF.

Die Konfigurationsanalyse identifiziert kleine, subtile Änderungen (Drift) und Audit-Compliance-Ausnahmen, wenn Konfigurationen nicht mit den Richtlinien für das Netzwerkdesign übereinstimmen. Sowohl Drift als auch Audit sind wichtige Funktionen, um zu gewährleisten, dass die Netzwerkkonfigurationen dem vorgesehenen Design und Betrieb entsprechen.

Performance Monitoring

Performance Monitoring erfasst Daten zur Geräteleistung, wie CPU- und Speicherauslastung, Temperatur, Versorgungsspannungen und Lüfterparameter. Die Interface-Performance-Daten werden verwendet, um Ausfälle, Paketverlust, Überlastungen und andere Netzwerkprobleme zu erkennen.

Die Daten werden per SNMP, Windows Management Instrumentation (WMI), CLI oder Telemetrie ermittelt. Netzwerkgeräte und Linux-basierte Endpunkte stützen sich in der Regel auf SNMP oder Telemetrie zur Datenerfassung, während Windows-basierte Geräte auf das Remote-Protokoll WMI angewiesen sind. WMI ist ein Client-Server-Framework, das die Systemverwaltung mithilfe des Common Information Models (CIM) ermöglicht, das die Komponenten des Betriebssystems abbildet.

Telemetrie

Neuere Geräte und Monitoring-Systeme können Netzwerktelemetrie nutzen, um Daten zur Netzwerk-Performance an ein Netzwerk-Monitoring-System zu übermitteln. Telemetrie kann per Extensible Markup Language (XML) oder JavaScript Object Notation (JSON) kodierte Daten verwenden. Einige Netzwerk-Monitoring-System und zugehörige Netzwerkgeräte nutzen REST-Schnittstellen (Representational State Transfer), um Daten in den entsprechenden Datenformaten zu sammeln.

IP-Adressmanagement

Die IP-Adressverwaltung überwacht die Belegung von IP-Adressen und kontrolliert die Vergabe von Adressen an Netzwerkgeräte. Für diese Funktion nutzt man üblicherweise die Befehlszeile oder eine Programmierschnittstelle (Application Programming Interface, API) zu anderen Netzwerkmanagementsystemen.

Topologie-Mapping

Die Topologie- und Mapping-Funktion sammelt Geräteverbindungsdaten, um physische und logische Topologiekarten zu erstellen, die die Grundlage für ein grundlegendes Troubleshooting bilden. Per SNMP-Polling oder CLI werden Daten zu Routing-Nachbarn (Layer 3), Switching-Nachbarn (Layer 2), Adressübersetzungstabellen (Layer-2-zu-Layer 3-Mapping) und Neighbor-Discovery-Protokollen, wie dem Link Layer Discovery Protocol (LLDP), ermittelt.

Digital Experience Monitoring

Digital Experience Monitoring nutzt aktive Testing Tools, zum Beispiel Ping, Traceroute und synthetisches Monitoring, um zu prüfen, ob das Netzwerk wie vorgesehen funktioniert. Es können auch Softwareagenten zum Einsatz kommen, die auf Endpunkten wie Servern und Arbeitsplatzrechnern laufen, um Daten zur Anwendungs- und Netzwerk-Performance zu erfassen. Durch die Kombination von Application Performance Monitoring (APM) und Netzwerk-Monitoring können IT-Abteilungen diagnostizieren, ob ein Anwendungsproblem auf das Netzwerk oder einen anderen Faktor, beispielsweise externe Netzwerke, zurückzuführen ist.

Sicherheit und Automation

Die Architektur sollte Sicherheit und Automatisierung durchgängig integrieren. Sicherheit ist nach wie vor ein wichtiges Element für ein reibungslos funktionierendes Netzwerk, und Automatisierung dient dazu, eine einheitliche Implementierung von Netzwerkrichtlinien zu gewährleisten. Das Sicherheitsdesign sollte Geräte für Intrusion Detection und Intrusion Prevention sowie die Software zu deren Überwachung und Verwaltung umfassen. Automation kann durch separate Tools erfolgen oder in ein NCCM-System integriert werden.

Durch die Kombination von Daten aus mehreren Quellen ist ein Netzwerk-Monitoring-System in der Lage, Ausfälle schnell zu erkennen und Performance-Probleme zu melden, bevor sie Anwendungen beeinträchtigen, die das Netzwerk nutzen.

Wie funktioniert Netzwerk-Monitoring?

Beim Netzwerk-Monitoring werden große Datenmengen erfasst und analysiert, um konkrete oder potenzielle Netzwerkprobleme zu erkennen, die man untersuchen sollte. Eine Möglichkeit, die Datenmenge zu reduzieren, besteht darin, ein Ranking der Ausnahmen von Analyseregeln unter Zuhilfenahme von Top-N-Berichten, zum Beispiel Top 10, zu erstellen. Nachfolgend einige Beispiele für die einzelnen Architekturelemente:

  • Ereignisse: Die Geräte, die die meisten Ereignisse oder die am häufigsten auftretenden Ereignisse melden.
  • NCCM: Die wichtigsten Geräte mit Konfigurationsänderungen oder die Geräte mit den meisten Konfigurationsänderungen.
  • Performance: Die Schnittstellen mit der höchsten Auslastung, Schnittstellen mit den meisten Fehlern nach Anzahl oder Prozentwerten sowie Pakete oder Geräte mit der größten CPU- oder Speicherauslastung.
  • Adressverwaltung: Subnetze, in denen fast keine Adressen mehr zur Verfügung stehen.
  • Topologie: Geräte mit den meisten Änderungen bei den Nachbarn.
  • Digital Experience Monitoring: Die Systeme, die die langsamsten Anwendungen melden, oder die Pfade mit den meisten Problemen.

Unternehmen benötigen häufig für jedes Architekturelement ein anderes Tool. Die Zusammenführung der Berichte an einem Ort bietet einen präzisen Überblick über den Netzwerkbetrieb. Die Berichte müssen Links zu den gesammelten Daten unterstützen, damit Netzwerkadministratoren ein detailliertes Troubleshooting vornehmen können.

Vorteile von Netzwerk-Monitoring

Zu den Vorteilen von Netzwerk-Monitoring zählen folgende Aspekte:

  • Sofortige Benachrichtigung über den Ausfall eines Netzwerkgeräts oder Servers.
  • Schnelle Identifizierung von Sicherheitsbedrohungen.
  • Warnung der Netzwerkadministratoren vor Fehlern und Performance-Problemen im Netzwerk oder in den Anwendungen, so dass sie Netzwerkprobleme rascher beheben können.
  • Nachverfolgung von Änderungen an Netzwerkkonfigurationen und der Konnektivität, die ein Netzwerkproblem verursachen könnten.
  • Automatisierte Konfiguration von Netzwerkgeräten.
  • Identifizierung, ob ein Problem mit der Anwendungs-Performance auf das Netzwerk oder eine andere Ursache zurückzuführen ist.
  • Performance-Visualisierung der IT-Infrastruktur.

Ein gut funktionierendes Netzwerk-Monitoring-System ermöglicht es den Netzwerkadministratoren, Verschlechterungen der Performance proaktiv anzugehen und schnell auf Netzwerkausfälle zu reagieren. Die Erweiterung von Netzwerken auf Cloud-Implementierungen und Software as a Service (SaaS) hat den Umfang und die Komplexität des Monitorings stark erhöht.

Software für Netzwerk-Monitoring

Netzwerk-Monitoring-Software kann von vielen verschiedenen Quellen bezogen werden, etwa von Open-Source- und kommerziellen Anbietern. Für Open Source Tools gibt es häufig eine kostenpflichtige Support-Version, die meist Premium-Funktionen enthält, die über die in der kostenlosen Version enthaltenen Features hinausgehen. Wenn in einem Netzwerk Geräte verschiedener Hersteller eingesetzt werden, muss das Netzwerk-Monitoring-System diese Produkte unterstützen. Vom Hersteller bereitgestellte Software unterstützt selten Geräte anderer Hersteller.

Monitoring Tools berücksichtigen die Ausweitung der Netzwerke auf Cloud und SaaS. Die Netzwerkausrüster implementieren oft Controller-basierte Architekturen, die über viele der erforderlichen Überwachungs- und Kontrollfunktionen verfügen. Diese Controller umfassen im Allgemeinen APIs zur Integration in Automatisierungssysteme und andere Tools für Netzwerk-Monitoring und Netzwerkmanagement.

Die Suche nach einem einheitlichen Verwaltungs-Tool ist schwierig. Die vielfältigen Funktionen, die für das Netzwerkmanagement erforderlich sind, machen es für ein einzelnes Produkt zu einer Herausforderung, alle Anforderungen abzudecken. Der erfolgreichste Ansatz besteht darin, ein Netzwerk-Monitoring-Tool auf die entsprechende Funktionskategorie abzustimmen. Ein System zur Ereignisverarbeitung hat beispielsweise andere Anforderungen als ein System für Netzwerk-Performance-Monitoring (NPM). Die Erfassung nützlicher Übersichten, wie der Top-N-Berichte, in einem einzigen Dashboard führt oft zu den besten Ergebnissen.

Unternehmen sollten auch die personellen Anforderungen im Blick haben. Monitoring Tools sollten von mindestens zwei Mitarbeitern betreut werden, die das System auf dem neuesten Stand halten können und Experten für den Betrieb sind.

Als Faustregel für die Kosten von Netzwerk-Monitoring und Netzwerkmanagement gilt, dass sie 10 Prozent der jährlichen Amortisationskosten des Netzwerks nicht übersteigen sollten. Diese Softwarepakete sind sehr aufwendig in der Entwicklung, und Unternehmen kaufen in der Regel nur eine Kopie. Man sollte nicht erwarten, dass sich ein Netzwerk im Wert von einer Million Euro mit einem System für 20.000 Euro überwachen und verwalten lässt. Alternativ können Netzwerkadministratoren die Kosten für die Netzwerk-Downtime berechnen und diese in die Kosten für die Netzwerk-Monitoring-Systeme einbeziehen.

Beispiele für Netzwerk-Monitoring

Ein gutes Beispielsystem hängt von den Anforderungen ab, zum Beispiel der Menge der Ereignisse und der Anzahl der zu überwachenden Geräteschnittstellen. Große Netzwerke haben andere Anforderungen als die eines kleinen Unternehmens. Komplexe Multi-Cloud-, SaaS-, Colocation- und On-Premises-Rechenzentren erfordern auch komplexere Monitoring-Systeme.

Ein Netzwerk ist ein großes, kompliziertes System, in dem viele Dinge einwandfrei zusammenarbeiten müssen, um einen optimalen Netzwerkstatus und die bestmögliche Anwendungs-Performance zu gewährleisten. Es sollte als Gesamtsystem überwacht werden, nicht als eine Ansammlung einzelner Geräte. Es empfiehlt sich deshalb, nicht an einer vollständigen Abdeckung zu sparen. Lediglich eine Teilmenge der aktiven Data-Center-Schnittstellen und der wichtigsten Interfaces zu überwachen, ist ein Garant für einen unbemerkten Ausfall.

Diese Definition wurde zuletzt im Mai 2022 aktualisiert

Erfahren Sie mehr über Netzwerk-Monitoring und -Analyse

ComputerWeekly.de
Close