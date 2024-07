Geht es um RAID-Systeme, stehen Anwender vor der Entscheidung, welche RAID-Level sie konfigurieren sollen. Für kleinere Systeme mit zwei bis vier Laufwerken, wie sie bei Privatanwendern und kleinen bis mittleren Büros und Unternehmen eingesetzt werden, kommen typischerweise RAID 1, 5 oder 10 infrage. Ein Labortest von Toshiba zeigt, welche Leistung dedizierte NAS- und DAS-Systeme sowie Server mit RAID-Controller und Software-defined Storage in unterschiedlichen Konfigurationen liefern.

RAID-Systeme erfreuen sich nicht nur in Unternehmen, sondern auch Bürogemeinschaften und Privathaushalten großer Beliebtheit, da sie eine höhere Ausfallsicherheit und Performance als einzelne Festplatten bieten. Zumindest in der Theorie ist auch klar, welche Vor- und Nachteile die gebräuchlichsten RAID-Konfigurationen aufweisen.

Ein RAID 5 verteilt die Datenblöcke und Paritätsinformationen über alle zur Verfügung stehenden Laufwerke, wobei in einem System mit vier HDDs aus jeweils drei Stripes von drei HDDs eine Parität errechnet und auf der vierten HDD gespeichert wird. Dadurch stehen 75 Prozent der Gesamtkapazität tatsächlich für Daten bereit – bei vier Laufwerken à 4 TB also 12 TB. Fällt eine Festplatte aus, lässt sich deren Inhalte aus den Informationen der drei verbleibenden Festplatten rekonstruieren. Den Ausfall einer zweiten Festplatte verkraftet ein RAID 5 nicht. Da Daten von drei Laufwerken parallel gelesen werden können, sind die Lesegeschwindigkeiten hoch. Geschrieben wird zwar ebenfalls parallel auf drei Laufwerken, doch das Berechnen und Schreiben der Paritäten geht zulasten der Schreibperformance.

Ein RAID 10 mit vier HDDs hingegen spiegelt die Daten von jeweils zwei Festplatten auf zwei weitere Festplatten, sodass zwei RAID 1 entstehen, die in einem RAID 0 stecken – deren Daten also über die Paare hinweg gestript werden. Dadurch steigt die Verfügbarkeit gegenüber RAID 5: Es können sogar zwei Laufwerke ausfallen, solange sie sich in verschiedenen RAID-1-Paaren befinden. Die Lesegeschwindigkeiten sollten ebenfalls hoch sein, da von allen vier Festplatten parallel gelesen werden kann. Das Schreiben ist allerdings nur auf zwei Festplatten parallel möglich. Zudem haben die hohe Verfügbarkeit und Leseperformance ihren Preis: Durch das Spiegeln stehen nur 50 Prozent der Gesamtkapazität zur Verfügung – bei vier Laufwerken à 4 TB sind es 8 TB.

Abbildung 1: Toshiba_mood_22_2.jpg Ein RAID-Verbund aus mehreren Festplatten hat eine höhere Ausfallsicherheit und Performance als einzelne Laufwerke (Quelle: Toshiba Electronics Europe)

Als kostengünstige Alternative zu diesen Konfigurationen mag ein RAID 1 mit nur zwei HDDs der doppelten Kapazität attraktiv erscheinen. Es stellt dieselbe Kapazität wie ein RAID 10 zur Verfügung und bietet durch die Spiegelung der Daten ebenfalls Ausfallsicherheit. Doch wie schlägt sich ein solches RAID 1 in Sachen Lese- und Schreib-Performance gegen RAID 5 und 10? Und welchen Durchsatz erreichen diese überhaupt in der Praxis? Antworten liefert ein Labortest von Toshiba.

Verschiedene RAID-Systeme im Vergleich Für den Test wurden Server mit den RAID-Controllern Broadcom MegaRAID 9560-8i und Microchip Adaptec SmartRAID 3204-8i bestückt. Da viele Server leistungsstark genug sind, um RAIDs ohne dedizierten Hardware-Controller zu verwalten, wurde ein System zudem mit Open-E JovianDSS als Software-RAID auf Basis des Dateisystems ZFS eingerichtet. Darüber hinaus kamen ein Qnap-NAS TS-464 und ein RD3640SU3, ein über USB verbundenes DAS-System (Direct Attached Storage) von Icy Box, zum Einsatz. Sie alle wurden mit vier Enterprise-HDDs von Toshiba ausgestattet, dem Modell MG08ADA400E mit 4 TB, und zunächst als RAID 5 konfiguriert. Nachdem dieses mit 6 TB Daten gefüllt war, wurde die Leistung beim sequenziellen Schreiben und Lesen mit 1-MB-Blöcken sowie bei gemischten Schreib/Lese-Workloads mit unterschiedlichen Block-Größen ermitteln – sowohl im Standard-Betrieb als auch nach dem simulierten Ausfall eines Laufwerks und während des RAID-Rebuilds. Die Messungen wurden dann in einer RAID-10-Konfiguration mit ebenfalls vier 4-TB-HDDs und in einer RAID-1-Konfiguration mit zwei 8-TB-HDDs (MG08ADA800E) wiederholt.

Die Leistung hängt vom Controller ab In Servern mit RAID-Controller liegen die sequenziellen Schreibgeschwindigkeiten von RAID 5 deutlich über denen von RAID 10, da auf drei und nicht nur auf zwei Laufwerke geschrieben werden kann. Beim sequenziellen Lesen hängt die Performance indes vom Controller ab: Während der Microchip-Controller im RAID 5 höhere Lese- als Schreibraten liefert, ist der Broadcom-Controller beim Lesen nicht schneller als beim Schreiben. Im RAID 10 hingegen übertrifft die Leseleistung bei beiden die Schreibleistung, wobei Microchip signifikant höhere Leseraten bietet. Bei gemischten Workloads sinkt die Performance drastisch und das RAID 10 hat die Nase vorn. Aus Performance-Sicht lohnt ein RAID 1 mit größeren Festplatten nicht, da es bei sequenziellen Arbeitslasten durchweg hinter RAID 5 und 10 liegt und nur bei gemischten Workloads einigermaßen mit RAID 5 mithalten kann. Vor allem beim Schreiben werden die Beschränkungen sichtbar, denn durch die Spiegelung werden Daten nur auf ein Laufwerk geschrieben. Abbildung 2: Broadcom-RAID-Controller.png Neben NAS-Komplettsystemen bietet auch Server die Möglichkeit ein RAID einzurichten – entweder über eine Hardware-Controller oder eine entsprechende Software (Quelle: Toshiba Electronics Europe) Fällt eine Festplatte aus, stehen die Daten in allen drei RAID-Konfigurationen weiterhin zur Verfügung, allerdings sinkt die Leseleistung, während die Schreibleistung gleichbleibt. Diese sinkt erst beim RAID-Rebuild – wie stark, hängt von der Konfiguration des Controllers ab. Hat der Rebuild eine hohe Priorität, geht er schneller vonstatten und die Schreib/Lese-Performance ist deutlich niedriger als bei einem Rebuild mit niedriger Priorität. In diesem Fall kann der Neuaufbau des RAIDs einige Stunden länger dauern. Insbesondere bei RAID 1 und 5 ist das eine kritische Phase, da in dieser Zeit keine weitere Festplatte ausfallen darf, damit es nicht zu Datenverlusten kommt. Das Software-RAID liegt bei sequenziellen Lasten auf einem ähnlichen Leistungsniveau wie Systeme mit Hardware-Controller und ist auch nach einen Festplattenausfall sowie während des RAID-Rebuilds relativ flott. Lediglich bei gemischten Workloads fällt es klar ab, was sich allerdings durch den Einbau einer kleinen SSD als Cache beheben lässt. Bei der Wiederherstellung des RAIDs bietet die Software-Variante einen Geschwindigkeitsvorteil, da software-definierte Speicher die Datenmenge auf den Festplatten kennen und nur diese Daten auf der Ersatzfestplatte neu erstellen. Ein Hardware-RAID erstellt in der Regel die gesamte Festplatte neu, selbst wenn diese nur teilweise mit Daten gefüllt ist.

Die Schnittstelle kann zum Flaschenhals werden Das NAS ist in allen Konfigurationen langsamer als Hardware-RAIDs, insbesondere bei gemischten Workloads, bei denen es ähnliche Leistungswerte wie das Software-RAID (ohne Cache) liefert. Bei sequenziellen Schreib- und Leseoperationen ist RAID 5 performanter, bei gemischten Arbeitslasten RAID 10. Bei den sequenziellen Leistungswerten gilt es jedoch zu beachten, dass das Netzwerk-Interface des NAS zum Flaschenhals werden kann: Viele Systeme sind mit 1 GbE bestückt und dadurch auf einen Durchsatz von etwa 100 MB/s limitiert. Selbst mit 2,5 GbE lassen sich lediglich rund 250 MB/s übertragen und damit so viel, wie ein RAID 1 erreicht. Vier Festplatten in einem RAID 5 oder 10 sind in diesen Systemen nur sinnvoll, wenn der größere Speicherplatz von RAID 5 oder die höhere Ausfallsicherheit und Performance bei gemischten Arbeitslasten von RAID 10 gefragt sind. Um die sequenziellen Datenraten von 500 bis 700 MB/s zu nutzen, die diese Konfigurationen liefern, wird ein NAS mit 10 GbE benötigt. Abbildung 3: Toshiba_RAID_Test_Messwerte.png Die Messwerte der RAID-Konfigurationen in den verschiedenen Systemen im Überblick (Quelle: Toshiba Electronics Europe) Ähnlich sieht es bei DAS-Systemen aus, bei denen der USB-Host die Übertragungsgeschwindigkeit häufig begrenzt. Da inzwischen Festplatten mit 20 TB und mehr erhältlich sind, dürfte ein DAS mit zwei großen HDDs in einem RAID 1 daher in den meisten Fällen eine bessere Wahl sein als ein RAID 5 oder 10 mit vier kleineren HDDs.