Sergej Khackimullin - Fotolia

5 häufige Fallstricke beim Netzwerk-Troubleshooting

Steigender Traffic, etwa durch das IoT, macht Netzwerke fehleranfälliger. Bewährte Troubleshooting-Methoden reichen bei der neuen Komplexität nicht.

Das Internet der Dinge (IoT) boomt: Laut Analystenhaus IDC werden smarte Geräte zunehmend in Unternehmensnetzwerke integriert. Sie versprechen effizientere Betriebsabläufe und ermöglichen neue Geschäftsmodelle. Allerdings bringt die neue Technik auch neue Anforderungen an die IT mit sich. Mehr Endgeräte und Verbindungen machen Netzwerke komplexer – und fehleranfälliger. Doch das IoT ist nur eine Quelle neuer Herausforderungen für IT-Abteilungen.

Auch andere Trends wie Cloud, Big Data und Virtualisierung, die immer mehr im Unternehmensalltag ankommen, führen zu steigenden Datenmengen und bringen IT-Infrastrukturen schnell an ihre Grenzen.

Ein effektives Troubleshooting wird daher zum erfolgskritischen Faktor. Doch mit der steigenden Systemkomplexität wird es auch immer schwerer, Fehlerquellen zu identifizieren. Bei der Behandlung von Netzwerkproblemen sollten Unternehmen daher auf eine Reihe von Fallstricken und Stolperfallen achten. Fünf davon haben wir zusammengefasst:

1. Voreilige Schlüsse über die zugrundeliegende Ursache ziehen

Um die Vorteile der digitalen Transformation auszuschöpfen, müssen Unternehmen eine störungsfreie Performance aller Prozesse im Netzwerk sicherstellen. Die richtige Ursache von Störungen zu finden, um sie im Anschluss effektiv beheben zu können, ist allerdings nicht immer leicht. Und der Zeitdruck ist oft hoch: Lässt die Leistung der unternehmenskritischen Systeme nach, können Kunden nicht auf Services zugreifen oder steht die Produktion still, dann kostet jede Minute Unterbrechung bares Geld.

Allerdings sollten IT-Verantwortliche auch unter Druck keine voreiligen Schlüsse ziehen und sich mit oberflächlichem Troubleshooting zufriedengeben. Denn die Probleme, mit denen Unternehmen es heute zu tun haben, sind komplex, treten teilweise nur vorübergehend auf und können sich in den Schattenbereichen der Systeme verbergen.

Und je mehr neue externe Ressourcen wie Cloud-basierte Anwendungen zur IT-Infrastruktur hinzukommen, desto mehr mögliche Fehler gibt es. Diese vielfältigen Fehlerursachen verlangen nach individuellen Lösungswegen. Selbst erfahrene IT-Administratoren können oft nicht auf den ersten Blick erkennen, was das konkrete Problem ist. Das zu wissen, ist aber Voraussetzung für die Fehlerbehebung.

2. Probleme durch Neustart beheben

Eine beliebte Art, Fehler zu beheben, ist ein Neustart des von der Störung betroffenen Systems. Doch selbst wenn das Vorgehen zunächst erfolgreich ist, handelt es sich oft nur um eine vorübergehende Lösung, bei der die eigentliche Ursache verschleiert wird – und das gleiche Problem könnte schon nach kurzer Zeit erneut auftreten. Sinnvoller ist es, so viele Informationen wie möglich zu sammeln, um die genaue Fehlerursache zu finden.

Was funktioniert noch und was nicht? Reagiert der Access Point weiterhin auf aktuelle Benutzer? Akzeptiert der Server neue TCP-Verbindungen? Ist die Switch-CPU zu 100 Prozent ausgelastet? Dabei ist es wichtig, alle Komponenten und Abläufe im Netzwerk genau zu kennen.

Denn durch die zunehmende Vernetzung und steigenden Traffic werden einzelne, bisher eigenständige Prozesse voneinander abhängig. Fällt eine Komponente aus, kann das Auswirkungen auf das gesamte System haben. Monitoring-Tools helfen dabei, Störungen im Netzwerk transparent zu machen und Fehler zu beheben. Am effektivsten sind Monitoring-Lösungen, die eine Ende-zu-Ende-Sicht über alle Netzwerkressourcen ermöglichen.

3. Hardware aufrüsten statt Probleme zu analysieren

Ein weiterer Fallstrick bei der Fehlerbehandlung kann der Versuch sein, Störungen durch Upgrades oder mehr Hardware zu beheben. Lässt die Leistung im Netzwerk nach, versuchen Unternehmen nicht selten, dies mit einer erhöhten WAN-Bandbreite oder aufgerüsteten Routern auszugleichen. Doch die Übertragungsrate im Netzwerk von 1 Gbit/s auf 10 Gbit/s zu erhöhen, bedeutet nicht unbedingt, dass das Netzwerk auch zehnmal so leistungsfähig ist.

Ist das Problem nicht die geringe Bandbreite, sondern ein Fehler, der die Performance senkt, lässt sich dieser durch ein Hardware-Upgrade auch nicht beheben. Dann wurde viel Geld ausgegeben, ohne die gewünschte Wirkung zu erzielen. Um solche teuren, unnötigen „Verbesserungen“ zu vermeiden, muss zuerst geklärt werden, was genau das Problem ist und welche Komponente im Netzwerk schuld daran sind. Erst wenn sichergestellt werden kann, dass sich das Problem mit einem Hardware-Update beheben lässt, sollten entsprechende Änderungen am Netzwerk durchgeführt werden.

4. Die falsche Hardware für das Troubleshooting verwenden

Nicht nur unnötig eingesetzte Hardware kann die Fehlerbehebung erschweren, sondern auch falsches Equipment bei der Suche nach Ursachen. Unternehmen sollten sich stets die Frage stellen: Was kann meine Hardware beim Troubleshooting leisten und wann sollte ich sie aufrüsten oder neu konfigurieren, bevor ich sie verwende? Denn ein falscher Switch oder Kabel- und Interfaceprobleme können die Verbindung zusätzlich beeinträchtigen und neue Störungen verursachen, anstatt alte zu beheben.

Außerdem sollten Unternehmen die Leistungsgrenzen ihrer Hardware kennen. Es kommt nicht selten vor, dass IT-Verantwortliche Tools zur Fehlerbehebung von einem Laptop aus bedienen, der nicht mit der hohen Geschwindigkeit der Datenverkehrsströme mithalten kann. Die meisten Standard-Laptops haben Probleme, nahtlos Geschwindigkeiten über 100 Mbit/s zu erfassen. Generell sollte jede physische Komponente vor der Implementierung oder Verwendung – egal, für ob für das Troubleshooting oder den gewöhnlichen Betrieb – getestet werden. Dazu gehört, Latenz und Durchsatz jeder Verbindung bis zum Kern des Netzwerks zu messen.

5. Den Aspekt Sicherheit vernachlässigen

Ein besonders fataler Fehler von Unternehmen ist es, das Thema Sicherheit zu vernachlässigen. Denn Störungen und Systemausfälle können auch von außerhalb verursacht werden: Vernetzte Geräte sind potenzielle Einfallstore für Cyberkriminelle – wie im Oktober 2016, als ein DDoS-Angriff auf den DNS-Provider Dyn das Internet an der Ostküste der USA für mehrere Stunden lahmlegte.

Unternehmen, die sich digital transformieren, müssen also Sorge dafür tragen, ihre Systeme gegen Angriffe abzusichern. Ein wichtiger Schritt dahin ist die Überwachung ihrer IT-Infrastruktur. Denn große Datenmengen und steigender Traffic vergrößern die Angriffsfläche und erschweren die Absicherung des Netzwerks vor Eindringlingen. Wo es früher noch ausreichte, ein Up/Down-Ping-Tool zur Überwachung zu verwenden, sind heute komplexere Mechanismen erforderlich.

“Unternehmen müssen sich auf die Folgen von steigender Vernetzung und wachsenden Datenmengen einstellen.”

Martin Klapdor, Netscout Deutschland

Um kriminellen Aktivitäten sowie daraus resultierenden Ausfälle vorzubeugen und sie im Ernstfall schnellstmöglich zu unterbinden, bedarf es einer permanenten Beobachtung und softwaregestützter Analyse von Traffic-Mustern in Echtzeit. Einbezogen werden sollten historische und Live-Daten aus Produktionssystemen oder Anwendungen.

Außerdem lohnt es sich, Verkehrsauslastungs- und Latenzstatistiken über wichtige Netzwerkverbindungen zu sammeln und Reaktionszeitmessungen, Paketerfassungsproben einschließlich typischer Gespräche und Protokolle sowie eine komplette Drahtlos-Bewertung durchzuführen. So lassen sich auffällige Verhaltensmuster schnell identifizieren und weitere Schritte zur Behebung einleiten.

Technologien wie Cloud Computing oder IoT bieten Anwenderunternehmen große Potenziale. Doch um sicherzugehen, dass Performance- und Sicherheitsprobleme die Vorteile nicht zunichtemachen, bedarf es Vorkehrungen, um auftretende Fehler schnell und systematisch zu erkennen und zu beheben. Dabei unterstützt ein systemweites Monitoring, das alle internen wie externen Ressourcen umfasst und auf ungewöhnliche Aktivitäten hinweist. Unternehmen müssen sich auf die Folgen von steigender Vernetzung und wachsenden Datenmengen einstellen. Während neue Technologien eingeführt und Services ausgerollt werden, müssen Geschäftsprozesse weiterhin reibungslos ablaufen. Nur, wenn dies gewährleistet ist, werden sie die digitale Transformation erfolgreich meistern.

Folgen Sie SearchNetworking.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Management von Netzwerkfehlern in modernen komplexen Rechenzentren

Häufige auftretende Netzwerk-Fehler und die Gründe dafür

Netzwerkanalyse für die schnelle Lösung von Serviceproblemen einsetzen

Kostenloses E-Handbook: Kaufberatung Netzwerk-Performance-Monitoring

Erfahren Sie mehr über WLAN

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close