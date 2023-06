Eine All-Flash-basierte Plattform für unstrukturierte Daten bietet ein neues Maß an Kapazität, Kosteneffizienz und Nachhaltigkeit – die insgesamt deutlich bessere Bilanz von Flash gegenüber der Festplatte lässt das All-Flash-Rechenzentrum in greifbare Nähe rücken.

Festplattenlaufwerke (Hard Disk Drives, HDDs) dominierten jahrzehntelang die IT-Infrastruktur. Seit den 1990er-Jahren kamen Solid-State-Laufwerke (Solid-State Drives, SSDs) auf den Markt, zunächst überwiegend in Consumer-Produkten. Die Nutzung von SSDs in Unternehmen setzte erst vor etwa 20 Jahren ein, aber nur im Bereich spezialisierter Hochleistungsanwendungen wie Datenbanken und Virtualisierung. Da Flash für den Masseneinsatz zu teuer war, waren die Rollen damit lange Zeit klar verteilt. SSDs waren von Anfang an zwar schneller, aber auch teurer. HDDs stellten eine große Speicherkapazität bereit, waren – und sind nach wie vor – langsamer, während SSDs beim Speicherplatz pro Kosten aufgeholt und mittlerweile gleichgezogen haben. Die führenden Festplattenhersteller stemmen sich mit ambitionierten Roadmaps einem möglichen HDD-Ende entgegen. So sind bei einzelnen Herstellern 30 Terabyte Kapazität in Reichweite, aber es ist auch bereits die Rede von 90 Terabyte bis 2030 und darüber hinaus sind sogar 120 Terabyte in Planung.

Unterschiede zwischen SSD und HDD Die Grundlage für den Geschwindigkeitsunterschied liegt in den physikalischen Eigenschaften der beiden Speichermedien und den allgemeinen physikalischen Gesetzen. Bei HDDs liest und schreibt der Kopf Daten auf die Platten, was bedeutet, dass die Geschwindigkeit der Platte die Geschwindigkeit des Lesens und Schreibens von Daten bestimmt. Die Daten werden magnetisch gespeichert, so dass ein starkes Magnetfeld sie beschädigen kann. Der Abstand zwischen Kopf und Platte ist kleiner als die Größe eines Staubkorns. Um Schäden durch Staubpartikel oder andere kleine Objekte zu vermeiden, werden Festplatten in einem staubfreien Reinraum hergestellt und sollten auch im Betrieb möglichst staubfrei bleiben. Eine HDD ist somit viel empfindlicher als eine SSD. Da sich der Kopf ständig über die Platten bewegt, besteht bei HDDs ein höheres Risiko für mechanisches Versagen. Die auf Flash-Speicherchips aufbauenden SSDs sind kleiner, was bereits seit den Anfängen im Consumer-Markt deutlich wurde, beispielsweise bei den USB-Sticks in Schlüsselanhängergröße. HDDs nutzen rotierende Platten, was sie aufgrund der erforderlichen Mechanik schwerer und größer als SSDs macht. Da SSDs aus Schaltkreisen bestehen, sind sie auch widerstandsfähiger gegen Beschädigungen, wenn die Hardware bewegt wird oder einen Stoß abbekommt. Bei SSDs besteht zudem nicht die Gefahr, dass Daten durch Magnetfelder beschädigt werden, so dass deren Verwendung in der Nähe von Geräten mit starken Magnetfeldern, wie etwa Telefonanlagen, keine spürbaren Auswirkungen hat. Anwendungen, die schnelle Datenübertragungen erfordern, profitieren am meisten von SSDs. Unternehmen könnten zum Beispiel einen Datenbankserver mit hoher Aktivität einsetzen, der Daten schnell lesen und übertragen muss, um die Leistung auf einem optimalen Niveau zu halten. Eine SSD kann generell Daten schneller lesen, speichern und vom Laufwerk an den Rechenprozess und den Speicher übertragen. Die Innovation ist jedoch auch bei Flash noch nicht ausgereizt. Dies zeigt zum Beispiel das von Pure Storage entwickelte DirectFlash-Modul (DFM), das Raw Flash über NVMe direkt mit dem Betriebssystem der Speichersysteme verbindet. Anders als bei herkömmlichen SSDs kommt im DFM kein Flash-Controller und kein FTL (Flash Translation Layer) zum Einsatz, sondern nur Raw Flash. Dieses Konzept beseitigt Performance-Hindernisse herkömmlicher SSDs.

SSD-Kosten pro Kapazität sind nun konkurrenzfähig Die jüngsten Fortschritte bei den SSD-Kosten pro Kapazität sorgen dafür, dass SSDs nicht nur für geschäftskritische Backups und Anwendungen mit höherer Leistung in Frage kommen, sondern für ein vollständig Flash-basiertes Rechenzentrum. Die Preiskonvergenz von HDDs und SSDs ist seit den letzten Jahren ein viel diskutiertes Thema, da Unternehmen nach effizienteren Lösungen für immer größere Datenmengen suchen. Heute sind Unternehmen bereits in der Lage, für ihren gesamten Datenspeicherbedarf dauerhaft von HDDs auf SSDs umzusteigen. In der Vergangenheit haben Unternehmen ihre Rechenzentren mit Festplattenlösungen bestückt, weil diese zumindest in der Beschaffung deutlich kostengünstiger waren, von der Ausfallquote und Wartung einmal abgesehen. Dies ging jedoch zu Lasten von Effizienz und Leistung. Flash-basierte Lösungen galten von Beginn an meist als überlegen, wurden aber im Kaufprozess aufgrund von Preisbedenken bei der Skalierung oft nicht berücksichtigt. Die neuesten Storage-Lösungen für unstrukturierte Daten könnten diese Bedenken nun endgültig ausräumen. Was die Kostenkalkulation betrifft, gilt es hier die Gesamtbetriebskosten, einschließlich laufender Ressourcen, Speichermanagement und anderer Faktoren, zu berücksichtigen.

Deutlicher Vorteil bei den Gesamtbetriebskosten Die Kosten waren lange Zeit eines der wesentlichen Hindernisse für Unternehmen, Flash in großem Umfang einzusetzen. Neben den nun gleichziehenden Kosten wird die Energieeffizienz immer wichtiger. Eine moderne UFFO-Plattform bietet eine nachhaltige Leistung bei bis zu fünfmal weniger Stromverbrauch als die zu ersetzenden plattenbasierten Systeme. Je größer die Speicherumgebung im Rechenzentrum ist, desto stärker macht sich der Effizienzvorteil bemerkbar. Dieser Aspekt wird immer wichtiger, denn Betreiber von Rechenzentren sehen sich nicht nur mit steigenden Stromkosten konfrontiert. Die Stromverfügbarkeit dürfte künftig auch zum Thema werden. Genau dies lässt sich bereits an der Reglementierung des Baus neuer Rechenzentren am zuvor überaus attraktiven Standort Irland beobachten. Um als Hersteller von All-Flash-Lösungen preislich konkurrieren zu können, war es entscheidend, sich von der Verwendung kommerzieller SSDs von der Stange abzuwenden und eigene Softwarefähigkeiten auf der eigenen Hardware, also eigenentwickelten Flash-Modulen, zu nutzen. Laut Herstellerangaben ist eine vollständig Flash-basierte Speicherplattform dieser Art 10- bis 20-mal zuverlässiger als festplattenbasierte Systeme. Dies bedeutet auch, dass es 10- bis 20-mal seltener nötig ist, Speichermedien zu tauschen. Indem Rebuilds vermieden werden, lassen sich zudem sowohl operative Kosten sparen als auch das Risiko senken. Für den nachhaltigen Betrieb sorgen auch Abo-Modelle zur laufenden Aktualisierung der bestehenden Systeme – ohne die üblichen kostenintensiven Forklift-Upgrades und wenig nachhaltiges Rip-and-Replace etwa alle sechs Jahre. Insgesamt niedrigere Betriebskosten bringen somit deutliche wirtschaftliche Vorteile, die über die Anschaffungskosten hinausgehen. Laut Angaben von Pure Storage kann der wartungsarme Betrieb, der geringere Platzbedarf und der geringere Stromverbrauch, auch aufgrund des niedrigeren Kühlungsbedarfs, die Gesamtbetriebskosten (TCO) über einen Zeitraum von sechs Jahren um etwa 40 Prozent senken.

Nachhaltigkeit wird zur Priorität, die es auch umzusetzen gilt Über die Kostenfaktoren hinaus sind sich Unternehmen der Nachhaltigkeitsprioritäten in den kommenden Jahren sehr bewusst. Dies belegt eine kürzlich von Pure Storage durchgeführte Studie, bei der 1.000 Leiter von Nachhaltigkeitsprogrammen in den USA, Großbritannien, Frankreich und Deutschland befragt wurden. Diese ergab, dass bei 78 Prozent der Unternehmen die Geschäftsführung Nachhaltigkeitsinitiativen als Priorität behandelt. Während 56 Prozent der Befragten angaben, dass sie die Nachhaltigkeitsziele innerhalb von drei bis sieben Jahren erreichen wollen, bestätigten nur 51 Prozent, dass sie auf dem richtigen Weg sind, ihre Ziele zu erreichen. 86 Prozent der Manager von Nachhaltigkeitsprogrammen sind der Meinung, dass Unternehmen ihre Nachhaltigkeitsziele nicht erreichen können, ohne den Energieverbrauch ihrer Technologieinfrastruktur deutlich zu senken. 81 Prozent sagen voraus, dass die Auswirkungen der Infrastruktur auf die CO2-Bilanz eines Unternehmens in den nächsten zwölf Monaten zunehmen werden. Storage-Experten stellen zunehmend fest, dass Unternehmen große Mengen an Inhalten länger speichern wollen. In der Welt der Datenanalyse ist außerdem zu beobachten, dass Data Lakes immer größer werden, da die Kunden Datensätze über immer längere Zeiträume speichern wollen. Der Wert von Daten und der Wunsch, Daten nicht zu löschen, bedeutet, dass diese Data Lakes immer größer werden. Somit ist es absolut notwendig, diese Daten mit einer effizienten Plattform bereitzustellen, die dennoch aktive Arbeitslasten unterstützen kann. Eine UFFO-Plattform kann somit auch als Speicherziel für ein langfristiges Datensicherungs-Repository dienen und parallel dazu dynamische Anwendungen wie Datenanalyse bedienen. Wenn die Rechenzentrumsfläche zur Unterstützung unstrukturierter Daten wachsen muss, werden Unternehmen einfach auch nicht das Budget haben, um die personellen Ressourcen zu erhöhen, um diese wachsende Umgebung zu unterstützen. All-Flash-Technologie im Rechenzentrum kann diesem Wachstum entgegentreten, in sie mehr Daten auf weniger Fläche bei geringerem Energieverbrauch und geringerer Abwärme bewältigt. Beim Rechenzentrumsdesign ist ebenso zu beachten, dass mehr Festplatten im System, etwa durch packungsdichtere Enclosures auch mehr Gewicht bedeuten, was unter Umständen bei Doppelböden gar nicht umsetzbar ist und dies zwangsläufig zu mehr Stellfläche führt. „Unternehmen können sich nicht länger auf Festplatten verlassen, wenn ihre Rechenzentren weiterwachsen, nicht nur aus Kostengründen, sondern auch wegen der Nachhaltigkeit und des Klimaschutzes. Eine All-Flash-basierte Plattform für unstrukturierte Daten bietet hingegen ein neues Maß an Kapazität, Kosteneffizienz und Nachhaltigkeit für das moderne Rechenzentrum.“ Markus Grau, Pure Storage Hinzukommt, dass die Datenanforderungen für Unternehmen in den nächsten Jahren weiter steigen werden. Die Plattformen, die für moderne Dateninitiativen geeignet sind, müssen daher immer effizienter werden und immer komplexere Umgebungen unterstützen. Wir gehen davon aus, dass sich die Kapazität der DirectFlash-Modul (DFM)-Arrays bis 2026 auf 300 Terabyte pro Modul wachsen wird. Systeme wie das FlashArray und FlashBlade unterstützen das AI Research SuperCluster (RSC) von Meta, das KI-Forscher zur Entwicklung neuer und besserer KI-Modelle nutzen. Diese lernen aus Billionen von Samples, arbeiten in Hunderten von verschiedenen Sprachen und analysieren nahtlos Text, Bilder und Videos. Ebenso ist es möglich, damit neue Augmented-Reality-Tools zu entwickeln und vieles mehr. Gerade bei Datenmengen in dieser Größenordnung, einem Exabyte im Vollausbau, ist das Thema Kosten stets präsent. Metriken wie zum Beispiel Watt/Terabyte und Stellfläche flossen hierbei in die Kalkulation mit ein.