whyframeshot - stock.adobe.com

Netzwerkredundanz: 7 Faktoren für ein gutes Netzwerkdesign

Netzwerkprofis müssen viele Faktoren berücksichtigen, wenn es um Redundanz im Netzwerkdesign geht. Dazu zählen Equipment, Protokolle, Backup, Processing und Subnetzverbindungen.

von

David Jacobs, The Jacobs Group

Zuletzt aktualisiert: 13 Juni 2023

Wenn das Netzwerk ausfällt, geht gar nichts mehr. Für einige Unternehmen ist eine Downtime von wenigen Minuten nicht kritisch. Für andere hingegen, etwa jene, die auf eine Erreichbarkeit von außen angewiesen sind, bedeuten wenige Minuten Downtime den Verlust von Einnahmen und, höchstwahrscheinlich, Kunden. Für diese Firmen ist es wichtig, ein Netzwerk zu gestalten, das trotz Ausfall einer Komponente weiter funktioniert.

Unternehmen, bei denen selbst eine kurze Ausfallzeit erhebliche Auswirkungen hat, müssen redundantes Equipment vorhalten und Verträge für redundante Services abschließen. Doch für Netzwerkredundanz zu sorgen, erhöht die Kosten und Komplexität. Jedes Unternehmen muss einen Kompromiss finden und die Downtime-Kosten gegen die Kosten für zusätzliche Geräte und Services abwägen.

Die folgenden sieben Faktoren sollten Netzwerkteams bei der Erstellung von Netzwerkredundanz-Designs berücksichtigen.

1. Switches und Router

Switches und Router sind zwar recht zuverlässig, fallen aber gelegentlich auch aus. Manche Organisationen halten es für ausreichend, einen zusätzlichen Switch oder Router in Reserve zu halten, so dass sie ein defektes Gerät schnell austauschen können. Organisationen mit kritischeren Anforderungen müssen redundantes Equipment bereits in den laufenden Betrieb integrieren.

2. Netzwerkprotokolle

Standardisierungsorganisationen haben Netzwerkprotokolle entwickelt, die bei einem Ausfall ein rasches Umschalten auf Backup-Geräte ermöglichen. Redundanz auf Layer 2 hinzuzufügen, bedingt, dass Teams mehr als einen einzelnen Switch mit jedem Subnetzsegment verbinden.

Diese zusätzlichen Switches erzeugen mehrere Pfade durch das Netzwerk, was zu Netzwerk-Flooding mit mehreren Kopien jedes Pakets führt. Der Spanning-Tree-Algorithmus bietet eine Möglichkeit, einen einzigen Pfad durch das Netzwerk festzulegen. Leider kann es bei Spanning Tree fast eine Minute dauern, um einen neuen Pfad zu bestimmen. Während dieser Zeitraum für einige Netzwerke akzeptabel sein könnte, erfordern andere ein schnelleres Recovery.

Um dies zu unterstützen, sind neuere Protokolle, darunter Multisystem Link Aggregation (MLAG), Transparent Interconnection of Lots of Links (TRILL) und Shortest Path Bridging (SPB) entwickelt worden. Netzwerkteams, die Designs für redundante Netzwerke entwerfen und auf ein schnelleres Recovery Wert legen, müssen entscheiden, welche Option für ihr Netzwerk am besten funktioniert.

Abbildung 1: Diese sieben Faktoren können die Redundanz von Netzwerkdesigns in Unternehmen erhöhen.

3. Subnetzverbindungen

Der nächste Schritt beim Hinzufügen von Redundanz besteht darin, Subnetze zu verbinden. Auch hier ist es notwendig, für mehrere Pfade zwischen den Subnetzen zu sorgen. Router verbinden die Subnetze innerhalb eines Netzwerks und mit externen Zielen. Damit Redundanz entsteht, muss jedes Subnetz mit mehreren Routern verbunden werden. Protokolle wie Open Shortest Path First (OSPF) und Enhanced Interior Gateway Routing Protocol (EIGRP) legen fest, wie Router sich gegenseitig über den aktuell optimalen Pfad zu jedem Ziel informieren.

Router erkennen, dass ein benachbarter Router ausgefallen ist, wenn von diesem Router mehrere Sekunden lang keine Routing Updates ankommen. Allerdings benötigen sowohl OSPF als auch EIGRP mehr Zeit für das Recovery als für einige Netzwerke akzeptabel ist. Mit dem Hot Standby Router Protocol (HSRP) und dem Virtual Router Redundancy Protocol (VRRP) lässt sich aber die Zeit für ein Recovery von einem Router-Ausfall reduzieren.

Eine Netzwerkverbindung kann aus vielerlei Gründen getrennt werden – zum Beispiel, weil jemand das falsche Kabel herauszieht, beim Einrichten einer neuen Verbindung eine andere lockert oder einfach beim Hantieren mit Equipment gegen ein Kabel kommt. Die Link Aggregation nach IEEE 802.3ad (PDF) definiert, wie man zwei Kabel für eine einzelne Verbindung nutzt. Solange die zwei Kabel verbunden sind, kann darüber Traffic geteilt werden, er fließt aber weiter, wenn eines getrennt wird.

4. Backup

Ein Festplattenausfall, der zu einem Datenverlust führt, kann ein Unternehmen ruinieren. Ein tägliches Backup reicht für einige Organisationen aus, während für andere der Verlust der Daten von einem Tag und die Zeit für die Wiederherstellung nicht akzeptabel ist.

RAID schützt vor dem Ausfall einer einzelnen Platte. Dafür stehen mehrere Schutzebenen zur Verfügung. Jede Dateneinheit kann auf zwei verschiedene Disks geschrieben werden. Höhere Schutzebenen definieren Wege, um zusätzliche Platten und Paritätsinformationen zu ergänzen. Somit können Teams die korrekten Daten wiederherstellen, falls zwei Disks, die identische Daten enthalten sollten, voneinander abweichen.

Ein kontinuierliches Cloud-Backup bietet Vorteile gegenüber den höchsten RAID-Leveln, denn wenn jede Datenänderung in die Cloud übertragen wird, bedeutet dies theoretisch, dass keine Daten verloren gehen. Die einzelnen RAID-Platten sind zusammen in einem einzigen Gehäuse untergebracht. Das heißt, Beschädigungen des Gehäuses können auch die einzelnen Disks in Mitleidenschaft ziehen. Gleichzeitig ist es immer noch notwendig, das Array periodisch zu sichern, aber die Daten, die nach dem jüngsten Backup hinzugekommen sind, sind trotzdem verloren.

5. Prozessoren

Wie andere Komponenten können auch Prozessoren ausfallen. Deshalb ist es wichtig, sie bei der Gestaltung redundanter Netzwerke zu berücksichtigen. Zusätzlich zu möglichen Ausfällen gilt es zu beachten, dass Prozessoren regelmäßig mit dem aktuellsten Systemsoftware-Release upgedatet werden müssen. Um einen permanenten Netzwerkbetrieb zu gewährleisten, ist es notwendig, dass Organisationen über ausreichende Extra-Ressourcen für das Processing verfügen.

Processing und Storage komplett in eine Public Cloud auszulagern, kann die Aufgabe vereinfachen, ein redundantes Netzwerkdesign zu entwerfen. Clouds besitzen viele Prozessor- und Storage-Einheiten, Anwendungen lassen sich bei einem Ausfall schnell zu einem anderen Prozessor verschieben, und redundantes Storage kann konfiguriert werden. Wenn durch ein Ereignis ein Standort geschlossen werden muss, kann das Processing einfach an einen anderen Ort verlagert werden.

6. Stromversorgung

Es liegt auf der Hand, dass ohne Strom nichts funktioniert. Es gibt eine Vielzahl von Gründen, warum er ausfallen kann, zum Beispiel durch einen Sturm oder umgeknickten Mast. Notstrombatterien oder -akkus sind in der Lage, bei einem Ausfall die Versorgung schnell zu übernehmen. Doch diese Option kann für große Einrichtungen eine erhebliche Zahl von Backup-Einheiten notwendig machen.

Das Umschalten auf einen Generator benötigt mehr Zeit, er kann aber auch bei einem längeren Blackout die Last bewältigen, wenn die Batteriekapazität nicht mehr ausreicht. In einigen Fällen ist es außerdem möglich, den Strom über zwei unterschiedliche Versorger zu beziehen, so dass sich der Ausfall einer Leitung verkraften lässt.

7. WAN und SD-WAN

WAN-Verbindungen sind schon immer wichtig gewesen. Doch das Wachstum von Cloud Computing und die Bedeutung von Remote-Nutzern haben dafür gesorgt, dass die Zuverlässigkeit des WANs immer entscheidender geworden ist.

Eine Option für Unternehmen besteht darin, die Anbindung über zwei verschiedene Netzwerk-Service-Provider bereitzustellen. Das bedeutet zwar höhere Kosten, schützt aber vor Ausfällen auf der Strecke zum Provider und in dessen Netzwerk.

Software-defined WAN (SD-WAN) bietet einen weiteren Weg, Netzwerkredundanz hinzuzufügen. MPLS-Leitungen sind ziemlich zuverlässig und garantieren ein bestimmtes Maß an Quality of Service (QoS), können aber ausfallen. Ein SD-WAN-Controller kann bei einem Ausfall den Traffic ins öffentliche Internet umleiten. Das Internet ermöglicht nicht das gleiche Maß an Zuverlässigkeit oder QoS-Garantien, bietet aber eine Möglichkeit, die Daten an ihr Ziel zu befördern.

Es gibt einen weiteren Vorteil von SD-WAN. Diese Technologie kann in Zeiten maximaler Last weniger kritischen Traffic ins Internet verlagern. Somit müssen Teams nicht das Maximum an MPLS-Bandbreite beschaffen, die im Jahr benötigt wird.

Berücksichtigen Sie Redundanz beim Netzwerkdesign

Das Hinzufügen von Redundanz erhöht die Kosten und die Komplexität. Designer sollten nicht mehr Netzwerkredundanz als nötig vorsehen. Weniger Redundanz ist aber auch nicht empfehlenswert, da selbst eine kurze Unterbrechung über Erfolg oder Misserfolg eines Unternehmens entscheiden kann.