luchschen_shutter - Fotolia

Hyperion-Studie: Wie man bei HPC versteckte Kosten entdeckt

High Performance Computing ist generell teuer, trotzdem übersehen Anwender oft weitere versteckte Kosten. Panasas und Hyperion wollen in einer Studie darauf aufmerksam machen.

Die TCO (Total Cost of Ownership) ist in der Regel ein wichtiger Entscheidungsfaktor bei der Beschaffung von IT-Ressourcen, unabhängig ob Hard- oder Software. Dabei sollen alle notwendigen Aufwende für diese Ressource berücksichtigt werden, die Kosten erzeugen, und dies über den gesamten Lebenszyklus der eingesetzten Lösung hinweg. Das bedeutet für Hardware, dass beispielsweise nicht nur die Anschaffungsinvestition in die TCO einfließt, sondern auch die Wartung, eventueller Personalaufwand oder Strom- und Stellplatzkosten. Gerade in teuren IT-Sparten wie High Performance Computing (HPC) sollten wirklich alle kostenerzeugenden Parameter betrachtet werden, um ungewollte Überraschungen zu vermeiden.

Laut einer Studie von Hyperion Research, die von Panasas in Auftrag gegeben wurde, ist dies im HPC-Umfeld leider nicht immer der Fall. Vielmehr gibt es immer noch zahlreiche HPC-Anwender, die durch solche versteckten Kosten überrascht werden. Die Studie soll Entscheidern bei der Anschaffungsplanung von HPC-Storage-Lösungen helfen.

Die Hyperion-Studie und ihre Resultate

In der Studie befragte Hyperion unter anderem Rechenzentrumsverantwortliche, IT-Planer, Finanzentscheider und Storage-Manager in Nordamerika, Asien und EMEA (Europe, Middle East, Africa), die für Unternehmen unterschiedlicher Größen arbeiten (mit einem jährlichen Umsatz zwischen fünf Millionen und zehn Milliarden US-Dollar). Dabei kamen 43 Prozent der Unternehmen aus dem Industriebereich, 38 Prozent aus dem akademischen Segment und 18 Prozent waren behördliche Einrichtungen. Die Studie will aufzeigen, welche Kriterien für IT-Mitarbeiter wichtig sind und welche vernachlässigt werden. Darüber hinaus fokussierte die Umfrage auf diese Faktoren:

  • Wachstumstreiber
  • Wachstumshemmschwellen
  • TCO
  • Ausfallzeiten
  • Zufriedenheit und Loyalität
  • Storage

Zunächst fragte Hyperion, welche Kriterien am wichtigsten bei der Auswahl eines HPC-Storage-Systems sind. Auf Platz eins findet sich Performance, gefolgt vom Kaufpreis und der TCO. Das ist nicht überraschend, da ein HPC-System für hohe Leistungen angeschafft wird und der Preis oft nicht das Budget überstrapazieren darf. Deswegen verwundert es auch nicht, dass die meisten Teilnehmer angaben, aufgrund transaktionsreicher Anwendungen und Workloads auf HPC zu setzen: 76,5 Prozent fallen auf multiple, wiederkehrende Workloads, 56,9 Prozent sind neue Workloads wie KI oder Big Data, und 49 Prozent bearbeiten einzelne große Workloads.

Abbildung 1: Die wichtigsten Entscheidungskriterien beim Kauf sind noch immer Performance und Preis/TCO.
Abbildung 1: Die wichtigsten Entscheidungskriterien beim Kauf sind noch immer Performance und Preis/TCO.

Die nachfolgenden Kriterien für die Auswahl eines HPC-Storage-Systems entsprechend ihrer Wichtigkeit sind laut Umfrage die Kompatibilität zur bestehenden Infrastruktur (24 Prozent), Skalierbarkeit und Upgrade-Fähigkeit (18 Prozent), Architektur (14 Prozent) sowie die Anzahl an benötigtem Personal (10 Prozent). Weniger ins Gewicht fielen die Resilienz (8 Prozent), die Langlebigkeit des Systems (6 Prozent) und der Software-Support.

Für Jim Donovan, CMO bei Panasas, sind aber auch diese Faktoren entscheidend für eine gute TCO und einen erfolgreichen Einsatz eines HPC-Storage-Systems: „Die Herausforderungen, die wir auch durch diese Studie sehen, liegen oft darin, geschultes Personal zu finden, das Tuning und den Wartungsaufwand mit einzubeziehen sowie Ausfallzeiten und damit finanziellen Verlust zu vermeiden“, betont Donovan. „Die Studie belegt ganz klar, dass Mitarbeitermangel und Administrationskosten die größten Probleme für Anwender darstellen.“

Abbildung 2: Die Herausforderungen beim HPC-Storage können versteckte Kosten verursachen.
Abbildung 2: Die Herausforderungen beim HPC-Storage können versteckte Kosten verursachen.

Und auch die Wachstumskurve darf nicht vernachlässigt werden. Laut der Hyperion-Studie gaben 52,9 Prozent der Befragten an, jährlich zwischen 11 und 25 Prozent im HPC-Bereich zu wachsen. Ist eine neu erworbene Lösung diesem Anstieg nicht gewachsen, verringert dies die TCO beträchtlich und führt zu zusätzlichen, ungeplanten Investitionen. Dabei spielen auch die Mitarbeiter und deren Effizienz eine Rolle, so Donovan. Die Studie belegt, dass ein Großteil der Umfrageteilnehmer nur ein bis drei Mitarbeiter für HPC im Einsatz hat (43 Prozent). Da die meisten Unternehmen (31,4 Prozent) die jährlichen Kosten für das Storage-Management-Personal bei zwischen 100.000 und 300.000 US-Dollar einstufen, ist es verständlich, dass ein HPC-System einfach zu bedienen und zu warten sein muss, um hier die Kosten nicht in die Höhe zu treiben.

Abbildung 3: Anspruchsvolle Workloads treiben Anwender zum Kauf von HPC-Lösungen.
Abbildung 3: Anspruchsvolle Workloads treiben Anwender zum Kauf von HPC-Lösungen.

Oft vernachlässigt werden zudem die Parameter des Tunings, der Recovery-Zeit bei einem Systemausfall und die Kosten für die Ausfallzeit an sich. Auch hier zeigt die Studie, wie sich die Realität der Anwender gestaltet. 47 Prozent gaben an, ein monatliches Tuning des Systems durchführen zu müssen, 41 Prozent erlebten innerhalb eines Jahres ein bis fünf Storage-Probleme, die die Produktivität negativ beeinträchtigte. In Sachen Ausfallfrequenz gaben acht Prozent der Befragten an, wöchentliche Ausfallzeiten zu verzeichnen, die Majorität (34 Prozent) erfuhr Ausfälle monatlich. Erfreulich dabei ist allerdings, dass die Recovery-Zeit bei den meisten (59 Prozent) weniger als einen Tag betrug.

Abbildung 4: Ausfallzeiten verursachen Kosten, doch manche Anwender wissen nicht, wie viel eine Störung sie kostet.
Abbildung 4: Ausfallzeiten verursachen Kosten, doch manche Anwender wissen nicht, wie viel eine Störung sie kostet.

Wiederherstellungsbemühungen, die zwei oder drei Tage in Anspruch nehmen, sind bei 24 Prozent der Studienteilnehmer zu verzeichnen und nur drei Prozent benötigen mehr als eine Woche, um sich von einem Ausfall zu erholen. Die Kosten für einen Tag, an dem das HPC-Storage-System nicht funktioniert, bezifferten 41 Prozent bei unter 100.000 US-Dollar, 14 Prozent zwischen 100.000 und 500.000 US-Dollar und sechs Prozent zwischen 500.000 und einer Million US-Dollar. Nur vier Prozent schätzten den finanziellen Verlust höher als eine Million pro Tag ein. Erschreckend hier ist, dass 35 Prozent der befragten Anwender nicht wissen, wie viel sie ein Tag Ausfallzeit kostet.

Fazit der Umfrage

TCO ist ein Begriff, der in der HPC-Gemeinschaft unterschiedlich verwendet wird und daher den Befragten dieser Studie bewusst ohne Definition vorgelegt wurde. Dies hatte den Vorteil, dass die Befragten ihre eigenen Definitionen anwenden konnten. Als sie dies taten, stellte sich TCO als eines der wichtigsten Kaufkriterien der untersuchten Standorte heraus - in seiner Bedeutung an den „Preis“ gebunden und nur an zweiter Stelle nach der „Leistung“ der betrachteten HPC-Speichersysteme.

Als Kategorie, so zeigt die Studie, haben HPC-Speichersysteme in der gegenwärtigen Ära der digitalen Transformation und der Hochleistungsdatenanalyse, einschließlich KI-Methoden wie maschinelles und tiefes Lernen (Deep Learning), erheblich an Bedeutung gewonnen.

Um den sich abzeichnenden Anforderungen an die Konvergenz von Simulation und Analyse, traditionellen und Unternehmensumgebungen sowie der Interoperation mit Cloud-Infrastrukturen gerecht zu werden, sind HPC-Speichersysteme, wie auch andere Teile des HPC-Ökosystems, in vielen Fällen komplexer geworden und schwieriger zu verwalten. Wie die Studie zeigt, sind HPC-Speichersysteme Ausfallzeiten ausgesetzt, die die Kosten erhöhen und gleichzeitig die Produktivität senken können, und es kann eine große Herausforderung sein, qualifizierte Bewerber für die Verwaltung von HPC-Speichersystemen zu finden. Diese Trends werden sich wahrscheinlich fortsetzen.

Vor dem Hintergrund dieser Faktoren rät Hyperion Research den HPC-Standorten, vor einer Kaufentscheidung ein breites Spektrum von HPC-Speicheranbietern zu evaluieren. Es gibt wichtige Unterschiede bei den Produkten, Strategien und dem Support der Anbieter. Eine breitere Suche könnte große TCO-Dividenden auszahlen.

Panasas stellt Berechnungshilfe für HPC-Storage bereit

Auf Basis dieser Studie hat Panasas eine allgemeine Rechnung angestellt und die Kosten für ein herkömmliches HPC-Speichersystem zusammengestellt. Über einen Fünfjahreszeitraum kamen laut dieser Berechnung über 12 Millionen US-Dollar zusammen und dies aufgrund der vorher nicht ersichtlichen Kosten. Diese versteckten Kosten gilt es zu vermeiden.

Abbildung 5: Die Panasas-Berechnung zeigt die versteckten Kosten von HPC-Storage.
Abbildung 5: Die Panasas-Berechnung zeigt die versteckten Kosten von HPC-Storage.

Damit HPC-Anwender keine bösen Überraschungen erleben und besser die TCO und somit den Ankauf neuer HPC-Storage-Systeme planen können, stellt das Unternehmen einen TCO-Rechner auf seiner Webseite zur Verfügung. Damit können IT-Entscheider eine Basis finden, unterschiedliche Speichersysteme zu vergleichen und für sich die Lösung mit dem besten Preis-Leistungsverhältnis zu finden. Im Portfolio von Panasas befinden sich zwei Versionen des HPC-Speicher ActiveStor: Ultra für ein effizientes Preis-Performance-Angebot und Prime als hybrides Scale-out-NAS. Beide basieren auf dem File-System PanFS, das hohe Parallelität bietet.

Erfahren Sie mehr über Storage Performance

ComputerWeekly.de
Close