Laurent - stock.adobe.com

KI-Speicher: NAS vs. SAN vs. Objekt für Training und Inferenz

KI stellt während Training und Inferenz verschiedene Anforderungen an den Speicher. Wir vergleichen, wie gut sich NAS, SAN und Objektspeicher für KI-Anwendungen einsetzen lassen.

Künstliche Intelligenz (KI) ist auf riesige Datenmengen angewiesen. Unternehmen, die KI-Projekte durchführen, insbesondere für große Sprachmodelle (LLMs) und generative KI (GenAI), müssen große Datenmengen für das Modelltraining erfassen und die Ergebnisse von KI-fähigen Systemen speichern.

Diese Daten befinden sich jedoch in der Regel nicht in einem einzigen System oder an einem einzigen Ort. Kunden greifen auf mehrere Datenquellen zu, darunter strukturierte Daten in Datenbanken und häufig auch unstrukturierte Daten. Einige dieser Informationsquellen befinden sich am eignen Standort, andere in der Cloud.

Um den Datenhunger der künstlichen Intelligenz zu stillen, müssen Systemarchitekten Speicherlösungen wie Storage Area Networks (SAN), Network Attached Storage (NAS) und auch Object Storage in Betracht ziehen und vergleichen.

In diesem Artikel betrachten wir die Vor- und Nachteile von Block-, Datei- und Objektspeichern für KI-Projekte und die Herausforderung, die richtige Mischung für Unternehmen zu finden.

Die Datenberge der KI

Die aktuelle Generation von KI-Projekten zeichnet sich selten, wenn überhaupt, durch eine einzige Datenquelle aus. Stattdessen greifen generative KI-Modelle auf eine Vielzahl von Daten zurück, von denen ein Großteil unstrukturiert ist. Dazu gehören unter anderem Dokumente, Bilder, Audio- und Videodateien sowie Computercode.

Für das Training von LLMs gilt: Je mehr Datenquellen, desto besser. Gleichzeitig verknüpfen Unternehmen LLMs jedoch direkt oder über Retrieval Augmented Generation (RAG) mit ihren eigenen Datenquellen, um die Genauigkeit und Relevanz der Ergebnisse zu verbessern. Bei diesen Daten kann es sich um Dokumente handeln, aber auch um Unternehmensanwendungen, die Daten in einer relationalen Datenbank speichern.

Ein Großteil der KI basiert auf unstrukturierten Daten, sodass Anwendungen auf Dateien, Bilder, Videos, Audiodateien – also allesamt unstrukturierte Daten – verweisen. Firmen sehen sich allerdings auch ihre Produktionsdatensätze an und möchten diese mit ihren generativen KI-Projekten verknüpfen, was wieder eine eigene Herausforderung ist.

Dazu gehört auch die Vektorisierung von Datenbanken, die von den wichtigsten Anbietern relationaler Datenbanken wie Oracle unterstützt wird.

NAS und SAN

Für Systemarchitekten, die KI-Projekte unterstützen, stellt sich die Frage, wo Daten am besten gespeichert werden sollen. Die einfachste Option wäre, die Datenquellen unverändert zu lassen, aber das ist nicht immer möglich.

Dies kann daran liegen, dass Daten weiterverarbeitet werden müssen, die KI-Anwendung von den Produktionssystemen isoliert werden muss oder die aktuellen Speichersysteme nicht über den für die KI-Anwendung erforderlichen Durchsatz verfügen.

Darüber hinaus führt die Vektorisierung in der Regel zu einem starken Anstieg des Datenvolumens – eine Verzehnfachung ist keine Seltenheit –, was höhere Anforderungen an den Produktionsspeicher stellt.

Das bedeutet, dass der Speicher flexibel und skalierbar sein muss und dass die Anforderungen an die Datenverarbeitung in KI-Projekten in jeder Phase unterschiedlich sind. Das Training erfordert große Mengen an Rohdaten, während die Inferenz – also die Ausführung des Modells in der Produktion – zwar weniger Daten, aber einen höheren Durchsatz und minimale Latenzzeiten erfordert.

Unternehmen neigen dazu, den Großteil ihrer unstrukturierten Daten auf NAS-Speichern mit Dateizugriff zu speichern. NAS hat den Vorteil, dass es relativ kostengünstig und einfacher zu verwalten und zu skalieren ist als Alternativen wie Direct Attached Storage (DAS) oder SAN-Speicher mit Blockzugriff.

Strukturierte Daten werden eher in Blockspeichern gespeichert. In der Regel erfolgt dies auf einem SAN, obwohl direkt angeschlossene Speicher für kleinere KI-Projekte ausreichend sein können.

Hier gleicht die beste Leistung – in Bezug auf IOPS und Durchsatz des Speicher-Arrays – die größere Komplexität von NAS aus. Unternehmensproduktionssysteme wie Enterprise Resource Planning (ERP) und Customer Relationship Management (CRM) verwenden SAN oder DAS, um ihre Daten in Datenbankdateien zu speichern. In der Praxis werden Daten für KI also wahrscheinlich aus SAN- und NAS-Umgebungen abgerufen. Hierbei kommt es darauf an, wie die KI-Tools auf die Daten zugreifen wollen oder müssen. Darüber hinaus gilt es zu beachten, dass sich KI-Daten im SAN speichern lassen, KI-Tools diese Blöcke aber in der Regel nicht lesen können. Dafür kommt eine Art Dateizugriffsprotokoll zum Einsatz, die den Zugriff auf die Blockdaten ermöglicht.

Es ist nicht unbedingt so, dass ein Protokoll besser ist als das andere. Das hängt stark von der Art der Datenquellen und der Ausgabe des KI-Systems ab.

Für ein hauptsächlich dokumenten- oder bildbasiertes KI-System könnte ein NAS-System schnell genug sein. Für Anwendungen wie autonomes Fahren oder Überwachung könnten Systeme ein SAN oder sogar einen lokalen Hochgeschwindigkeitsspeicher verwenden.

Auch hier müssen Datenarchitekten zwischen den Trainings- und Inferenzphasen ihrer Projekte unterscheiden und abwägen, ob der Aufwand für die Datenverschiebung zwischen Speichersystemen die Leistungsvorteile überwiegt, insbesondere im Training.

Objektspeicher

Dies hat einige Unternehmen dazu veranlasst, Objektspeicher als Option zur Vereinheitlichung von Datenquellen für KI in Betracht zu ziehen. Objektspeicher werden zunehmend in IT-Umgebungen eingesetzt, und zwar nicht nur im Cloud-Speicher – auch lokale Objektspeicher gewinnen Marktanteile.

Objekte bieten einige Vorteile für KI, nicht zuletzt ihre flache Struktur und ihren globalen Namensraum, den (relativ) geringen Verwaltungsaufwand, die einfache Erweiterbarkeit und die niedrigen Kosten.

Die Leistung war jedoch bisher keine Stärke von Objektspeichern. Daher eignen sie sich eher für Aufgaben wie die Archivierung als für Anwendungen, die eine geringe Latenz und einen hohen Datendurchsatz erfordern.

Storage-Anbieter arbeiten jedoch daran, diese Leistungslücke zu schließen. Pure Storage und NetApp verkaufen beispielsweise Speichersysteme, die Dateien und Objekte und in einigen Fällen auch Blöcke verarbeiten können. Dazu gehören FlashBlade von Pure und Hardware, auf der das Speichersystem OnTap von NetApp läuft. Diese Technologien geben Speichermanagern die Flexibilität, die besten Datenformate zu verwenden, ohne an bestimmte Hardware gebundene Silos zu schaffen.

Andere Anbieter, wie Hammerspace mit seinem Hyperscale NAS, wollen zusätzliche Leistung aus Geräten herausholen, auf denen das Netzwerkdateisystem (NFS) läuft. Dies verhindert Engpässe, bei denen der Speicher mit den datenhungrigen Grafikprozessoren (GPUs) nicht Schritt halten könne.

Alle Anforderungen erfüllen

Bis jedoch leistungsfähigere Objektspeichersysteme breiter verfügbar sind oder mehr Unternehmen auf universelle Speicherplattformen umsteigen, wird KI wahrscheinlich NAS, SAN, Objekte und sogar DAS in Kombination verwenden.

Allerdings dürfte sich das Gleichgewicht zwischen den einzelnen Elementen im Laufe eines KI-Projekts und mit der Weiterentwicklung der KI-Tools und ihrer Anwendungen verändern.

Bei generativer KI dreht sich alles um das Verstehen von Beziehungen. Die Quelldaten befinden sich noch in Ihren unstrukturierten Daten, entweder als Datei oder als Objekt, und Ihre vektorisierten Daten liegen auf Blöcken.

Erfahren Sie mehr über Storage-Hardware