alunablue - stock.adobe.com

Tipp

Diese 8 Faktoren helfen bei der Berechnung der HPC-Kosten

IT-Teams, die ihre HPC-Speicherkosten berechnen wollen, müssen nicht nur die Technologie berücksichtigen, sondern auch andere Kosten wie für Personal, Support und laufenden Betrieb.

von

Robert Sheldon

Zuletzt aktualisiert:09 Febr. 2021

High Performance Computing (HPC) erfordert Speichersysteme mit der notwendigen Leistung und Kapazität, um einen zuverlässigen Betrieb zu gewährleisten. Diese Systeme sind jedoch mit einem hohen Preis verbunden.

Der TCO für HPC-Speicher geht über den anfänglichen Preis pro Gigabyte hinaus, was bedeutet, dass IT-Teams andere Variablen berücksichtigen müssen. Hier sind acht Faktoren, die neben dem Preis des Systems selbst zu den HPC-Speicherkosten beitragen.

1. Sich entwickelnde Geschäftsanforderungen

Geschäftsanforderungen ändern sich im Laufe der Zeit, ebenso wie die Workloads, die sie unterstützen. HPC-Speichermuss diese Änderungen, die Neukonfigurationen, Upgrades und Kapazitätserweiterungen erforderlich machen können, rechtzeitig berücksichtigen. Ein Speichersystem sollte zum Beispiel mit minimalen Ausfallzeiten skaliert oder angepasst werden können. Verzögerungen können zu Umsatzeinbußen und Produktivitätsverlusten führen. Selbst wenn die Unterbrechungen minimal sind, muss die IT-Abteilung die zusätzliche Hardware kaufen und bereitstellen, was die Gesamtbetriebskosten erhöht.

In einigen Fällen könnte ein Unternehmen sein Speichersystem überprovisionieren, um zukünftige Geschäftsanforderungen und Schwankungen der Arbeitslast zu berücksichtigen. Dies kann jedoch zu unnötigen Ausgaben und höheren langfristigen Wartungskosten führen, was ebenfalls den TCO erhöht. HPC-Systeme erreichen ohnehin nur selten eine 100-prozentige Auslastung - oft sind es eher 80 Prozent -, und ein überdimensioniertes Speichersystem kann die langfristigen Kosten weiter beeinflussen. Gleichzeitig sollte darauf geachtet werden, dass HPC-Speichersysteme nicht übermäßig ausgelastet werden, da dies die Anwendungsleistung und Produktivität beeinträchtigen kann.

2. Verlässlichkeit und Verfügbarkeit

Ein HPC-Speichersystem sollte einen kontinuierlichen Betrieb mit minimalen Serviceunterbrechungen unterstützen. Das System sollte in der Lage sein, Laufwerks- und Knotenausfälle sowie andere ungeplante Unterbrechungen zu bewältigen und dabei die Verfügbarkeit und Leistung aufrechtzuerhalten. Es gibt zwei Möglichkeiten, diese Anforderungen zu erfüllen: im Vorfeld in die richtige Speicherinfrastruktur investieren oder später mehr Zeit und Geld aufwenden, um das System am Laufen zu halten. Beide Optionen wirken sich auf den TCO aus, wobei letzteres oft zu höheren HPC-Speicherkosten führt.

Eine weitere Überlegung ist die Speicherkonfiguration. Bestimmte RAID-Levels halten zum Beispiel Parität über die Laufwerke hinweg aufrecht, um die Zuverlässigkeit zu erhöhen, aber dies erfordert zusätzliche Rohkapazität. Ein hochverfügbares Speichersystem implementiert typischerweise redundante Komponenten, wie Multipath-I/O oder duale Controller. Das IT-Team kann auch Ersatzteile vorhalten, wie zusätzliche Netzteile. Darüber hinaus müssen die Mitarbeiter regelmäßig Komponenten aktualisieren oder ersetzen. All diese Faktoren tragen zum TCO bei.

3. System- und Datensicherung

Für die meisten Unternehmen hat der Schutz der Speichersysteme und ihrer Daten höchste Priorität, aber dieser Schutz hat seinen Preis.

In die Speicherhardware, -software und -firmware integrierte Sicherheitsfunktionen können den TCO erhöhen, ebenso wie die täglichen Arbeitsabläufe, die für die Aufrechterhaltung einer sicheren Infrastruktur erforderlich sind. Beispielsweise erfordert die Verwaltung privater Schlüssel und Zugriffskontrollen, die Überwachung von Speicher- und Netzwerksystemen, die Einhaltung geltender Vorschriften und die Durchführung regelmäßiger Sicherheits- und Compliance-Audits Zeit und Ressourcen.

Eine Disaster-Recovery-Strategie trägt ebenfalls zum TCO bei. Backups, Snapshots und Failover-Vorgänge erfordern in der Regel zusätzliche Geräte, Software oder Services sowie Personal. Gleichzeitig müssen die IT-Teams die Speichersysteme physisch schützen, was zusätzliche Feuermelder, Erkennungsgeräte oder andere Überwachungstools erfordert.

4. Unterstützende Software und Dienstleistungen

Speicherhersteller bieten in der Regel optionale Support- und Serviceverträge an, die den TCO eines Systems erheblich erhöhen können. Der genaue Betrag hängt vom Anbieter und dem Umfang der Dienstleistungen ab. Unternehmen können sich für eine minimale Abdeckung zu geringeren Anfangskosten entscheiden, aber dies könnte das Risiko längerer Ausfallzeiten erhöhen, was später zu höheren HPC-Speicherkosten führt. Einige Drittanbieter bieten Speicherwartungsdienste an, die günstiger sein können als die Pläne des Anbieters, aber IT-Teams müssen diese Kosten trotzdem in den TCO einbeziehen.

Der TCO sollten auch alle Lizenzgebühren für Software berücksichtigen, die das Speichersystem unterstützt. Dazu gehören Software, die den Speicherbetrieb direkt unterstützt, sowie Software von Drittanbietern - beispielsweise ein spezialisiertes Dateisystem oder softwaredefinierter Speicher -, die in Verbindung mit dem HPC-Speichersystem verwendet wird. Darüber hinaus sollten die TCO-Berechnungen alle anderen Systeme oder Dienste berücksichtigen, die zur Verwaltung und Überwachung der Speicherinfrastruktur benötigt werden.

5. Speichernetzwerk-Infrastruktur

Ein Speichersystem muss in der Lage sein, mit anderen HPC-Komponenten und darüber hinaus zu kommunizieren. Dies erfordert eine zuverlässige Hochgeschwindigkeits-Netzwerkinfrastruktur, die den Betrieb aufrechterhalten kann.

Unabhängig davon, ob es sich bei der Netzwerkstruktur um Ethernet, Fibre Channel oder InfiniBand handelt, muss die IT-Abteilung Komponenten wie Kabel, Switches, Adapter oder Load Balancer bereitstellen und warten. Die Netzwerkkosten sind schwieriger zu berechnen, wenn es um die Speicher-Kosten geht, da andere HPC-Komponenten das Netzwerk mitbenutzen. Dennoch sollten der Speicher-TCO zumindest einen Prozentsatz dieser Netzwerkkosten widerspiegeln.

Wie das Speichersystem selbst kann auch die Netzwerkinfrastruktur eigene Serviceverträge oder Softwarelizenzgebühren haben. Darüber hinaus enthält das Netzwerk wahrscheinlich redundante Komponenten wie Switches oder Adapter, um einen Single Point of Failure zu vermeiden. Die IT-Abteilung kann Ersatzteile vorhalten oder andere Maßnahmen ergreifen, um Ausfallzeiten zu begrenzen und die Leistung aufrechtzuerhalten. Die Aktualisierungszyklen der Komponenten tragen ebenfalls zu den Netzwerkkosten bei.

6. Betriebsumgebung

Ein HPC-Speichersystem benötigt für den Betrieb Platz im Rechenzentrum. Obwohl die heutigen dichteren HPC-Systeme einen Teil dieses Platzes einsparen können, sollten IT-Teams diese Kosten immer noch in die TCO-Schätzungen einbeziehen, zusammen mit den damit verbundenen Wartungs- und Reparaturkosten für das Rechenzentrum.

Eine weitere große Ausgabe ist die Energie, die für die Stromversorgung und Kühlung des Speichersystems benötigt wird. Technologien wie Flash-Speicher können zwar den Stromverbrauch senken, erhöhen aber dennoch die Gesamtenergiekosten.

Der TCO sollte alle erforderlichen Änderungen am Rechenzentrum berücksichtigen, um das Speichersystem vorzubereiten. Ein dichterer Rack-Speicher könnte zum Beispiel eine aktualisierte Stromversorgung, eine verbesserte Kühlung oder einen verstärkten Bodenbelag erfordern. Das Rechenzentrum könnte auch mehr Verkabelung oder Brandschutzsysteme sowie zusätzliche Redundanz, wie einen zusätzlichen Generator oder eine unterbrechungsfreie Stromversorgung, benötigen.

7. Anforderungen an das Personal

Ein weiterer großer Aufwand ist das Personal, das für die Bereitstellung und Wartung eines HPC-Speichersystems benötigt wird. Dazu gehört die Zeit, die IT-Mitarbeiter für die Beschaffung, Einrichtung, Konfiguration, Integration und den Test des Systems aufwenden. Dazu gehört auch der laufende Verwaltungsaufwand, der komplex und zeitaufwändig sein kann. IT-Teams müssen sicherstellen, dass die Systeme mit maximaler Leistung und mit minimalen Unterbrechungen und Ausfallzeiten laufen, was den TCO erheblich erhöhen kann.

Der Übergangsprozess zu neuen Speichersystemen, einschließlich der Migration von Daten aus Altsystemen auf HPC-Speicher, erfordert ebenfalls Zeit und Ressourcen. In einigen Fällen müssen die IT-Teams qualifiziertes Personal für die Bereitstellung und Wartung des Systems rekrutieren oder das vorhandene Personal schulen. Dies hängt vom Speichersystem selbst und den Qualifikationen des Personals ab. In jedem Fall sind wahrscheinlich einige Investitionen erforderlich.

8. Ungeplante Ausfallzeiten

Um die Kosten zu senken, könnte ein Unternehmen versucht sein, ein weniger zuverlässiges Speichersystem zu kaufen oder die Investitionen in die Ausbildung und Einstellung von Mitarbeitern zu begrenzen. Dies kann jedoch zu längeren und häufigeren Ausfallzeiten führen - und zu potenziellen Umsatzeinbußen.

In einer im Mai 2020 veröffentlichten Studie von Hyperion Research gab etwa die Hälfte der Befragten an, dass ihre HPC-Speichersysteme einmal im Monat oder öfter ausfallen. Diese Befragten gaben an, dass die Ausfallzeiten von weniger als einem Tag bis zu mehr als einer Woche reichten und dass ein Tag Ausfallzeit zwischen weniger als 100.000 Dollar und mehr als 1 Million Dollar kosten kann.

HPC-Serviceunterbrechungen haben schwerwiegende Auswirkungen auf Unternehmen, die auf diese Technologie angewiesen sind, um weiterhin produktiv und innovativ arbeiten zu können. Wenn die Systeme ausfallen, kommt die Arbeit oft zum Stillstand, was zu langfristigen finanziellen Konsequenzen führt. Obwohl diese HPC-Speicherkosten schwer zu kalkulieren sein können, sollten Sie sie immer in die TCO-Schätzungen einbeziehen, insbesondere bei Produktvergleichen.