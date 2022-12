Mit der steigenden Leistungsfähigkeit von CPUs und GPUs für HPC-Anwendungen mussten auch Storage-Entwicklungen neu gedacht werden. Dank neuen Designs und Speichertechnologien hat HPC-Storage jedoch in den vergangenen Jahren an Fahrt aufgenommen.

High Performance Computing (HPC) ist aus Wissenschaft und Unternehmen nicht mehr wegzudenken. Klimaforschung, Medizin, Physik, aber auch Pharmaindustrie, Engineering und Finanzbranche benötigen extreme Rechen- und Speicherleistungen, um die anfallenden riesigen Mengen an Daten bewältigen und analysieren zu können. Marktforschungsunternehmen wie Hyperion Research prognostizieren für den HPC-Markt nicht umsonst ein starkes Wachstum.

Anwender wollen und müssen immer mehr Daten verarbeiten, komplexere Fragestellungen schneller beantworten und mehr Analysen in kürzerer Zeit durchführen. Während CPUs und GPUs in den vergangenen Jahren enorm an Performance zugelegt haben, konnte die Leistungsfähigkeit der Speichersysteme mit dieser Entwicklung nicht mithalten. Daher klafft eine Lücke zwischen der Rechenleistung und der Storage -Leistung, die es zu schließen gilt.

Mit Technologien wie ADAPT Erasure Coding (Autonomic Distributed Allocation Protection Technology) und ADR (Autonomous Drive Regeneration) kann zudem das Problem der Verfügbarkeit und Zuverlässigkeit adressiert werden. Durch sie lassen sich RAID -Systeme um bis zu 95 Prozent schneller wiederherstellen als in traditionellen Umgebungen und Festplatten im laufenden Betrieb automatisch reparieren. Dadurch sind deutlich weniger manuelle Festplattenwechsel nötig. Da die meisten fehlerhaften HDDs wieder zuverlässig in Betrieb genommen werden können, fällt außerdem weniger Elektroschrott an. Gleichzeitig sinken die Betriebskosten.

Ein weiterer Stolperstein auf dem Weg zu einer kosteneffizienten HPC-Umgebung ist das Datenmanagement. Eine segmentierte Datenhaltung in physisch isolierten Repositories führt zu hoher Komplexität und entsprechenden Managementkosten. Anwender sollten daher auf ein holistisches Datenmanagement setzen, das alle Storage-Tiers in einem logischen Layer zusammenfasst.

HPC-Speicher im Praxiseinsatz

Am Beispiel einer großen Forschungseinrichtung soll der Nutzen einer Tiering-Architektur für HPC-Anwendungen demonstriert werden. Das Forschungsinstitut entwickelt, baut und betreibt komplexe Großforschungsanlagen, die täglich enorme Datenmengen generieren.

Die Scale-Out Storage-Cluster des Instituts haben eine Größe im zweistelligen Petabyte-Bereich. Ein Backup-System ist an einem räumlich entfernten Standort für die Sicherung der Daten zuständig. Für das Backup werden die Daten konsolidiert, verdichtet und in einem lokalen Disk-basierten Backup-Cache gesammelt. Die an das Backup-System zu sendenden Files überschreiten häufig eine Größe von 16 TB, was eine enorme Herausforderung für das File-System darstellt. Die tägliche Bereitstellung des Backup-Volumens erfordert einen Storage-Durchsatz von wenigstens 10 GB/s.

„Um mit der Entwicklung im Compute-Bereich mitzuhalten, müssen Speichersysteme schneller, effizienter und zuverlässiger werden.“ André Ambrosius, Seagate Technologies

Um diese Herausforderungen zu meistern, setzt der HPC-Betreiber Seagate Exos CORVAULT-Speichersysteme ein. Mit 12 GB/s Schreibdurchsatz bieten sie die erforderliche Leistung. Der Durchsatz steigt linear durch jedes weitere System, das in das Cluster integriert wird. Zudem können bis zu vier SDS-Heads mit Multi-Protokollfunktionen den Storage redundant verwalten.

Das ADAPT Erasure Coding der redundanten RAID-Controller soll im Fehlerfall einen schnellen Restore ermöglichen. Die Festplatten speichern Daten der letzten 1.000 Betriebsstunden und können Laufwerksdefekte mittels ADR selbst beheben, ohne dass es zu Unterbrechungen kommt oder ein Administrator eingreifen muss.