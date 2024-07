Künstliche Intelligenz (KI) und maschinelles Lernen (ML) versprechen einen grundlegenden Wandel in der IT-Automatisierung, mit Anwendungen, die von einfachen Chatbots bis hin zu hochkomplexen Ebenen der Inhaltsgenerierung und Kontrolle reichen.

Storage ist ein wichtiger Bestandteil der KI, um Daten für das Training bereitzustellen und die potenziell riesigen Datenmengen zu speichern, die erzeugt werden, oder während der Inferenz, wenn die Ergebnisse der KI auf reale Arbeitslasten angewendet werden.

In diesem Artikel befassen wir uns mit den Hauptmerkmalen von KI-Workloads, ihrem I/O-Profil, den für KI geeigneten Speichertypen, der Eignung von Cloud- und Objektspeicher für KI sowie der Strategie und den Produkten von Speicheranbietern für KI-Umgebungen.

Datensätze können auch Teil des primären oder sekundären Datenspeichers sein, beispielsweise Verkaufsunterlagen oder Daten in Backups, die zunehmend als wertvolle Quelle für Unternehmensinformationen angesehen werden.

Die Datentypen in den Trainings- und Betriebsdatensätzen können von einer Vielzahl kleiner Dateien, zum Beispiel Sensorwerte im Internet der Dinge (IoT), bis hin zu sehr großen Objekten wie Bild- und Filmdateien oder diskreten Stapeln wissenschaftlicher Daten reichen. Die Dateigröße beim Ingestion hängt auch von den verwendeten KI-Frameworks ab.

Wo und wie KI- und ML-Workloads trainiert und ausgeführt werden, kann sehr unterschiedlich sein. Einerseits können sie Batch- oder einmaligen Trainings- und Inferenzläufen ähneln, die der High-Performance-Computing (HPC)-Verarbeitung bestimmter Datensätze in Wissenschafts- und Forschungsumgebungen ähneln. Andererseits kann KI, nachdem sie trainiert wurde, auf kontinuierliche Anwendungs -Workloads angewandt werden, wie zum Beispiel die oben beschriebenen Arten von Vertriebs- und Marketingoperationen.

KI und ML basieren auf dem Training eines Algorithmus , um Muster in Daten zu erkennen, Einblicke in die Daten zu gewinnen und häufig Reaktionen auf der Grundlage dieser Erkenntnisse auszulösen. Dabei kann es sich um sehr einfache Empfehlungen auf der Grundlage von Verkaufsdaten handeln, wie zum Beispiel die Empfehlung „ Kunden, die dieses Produkt gekauft haben, haben auch dieses erworben “. Es kann sich aber auch um komplexe Inhalte handeln, wie wir sie von großen Sprachmodellen (LLMs) in der generativen KI (GenAI) kennen. Diese werden auf umfangreichen und vielfältigen Datensätzen trainiert, um überzeugende Texte, Bilder und Videos zu erstellen.

Die Daten sind wahrscheinlich eher unstrukturiert und in großen Mengen vorhanden, als dass sie strukturiert und in Datenbanken gespeichert sind.

Die Infrastruktur muss auch in der Lage sein, massiv zu skalieren , um sehr große Trainingsdatensätze und Ergebnisse aus Training und Inferenz zu verarbeiten. Außerdem muss die Geschwindigkeit der Ein- und Ausgabe zwischen Speicherung und Verarbeitung hoch sein und möglicherweise auch die Übertragbarkeit der Daten zwischen verschiedenen Standorten verwalten können, um eine möglichst effiziente Verarbeitung zu ermöglichen.

Die Prozessierungsleistung muss außergewöhnlich hoch sein, damit KI-Training und Inferenz in einem angemessenen Zeitrahmen und mit möglichst vielen Iterationen durchgeführt werden können, um die Qualität zu maximieren.

Training und Schlussfolgerungen in KI-Workloads erfordern in der Regel eine massiv parallele Verarbeitung unter Verwendung von Grafikverarbeitungseinheiten ( GPUs ) oder ähnlicher Hardware, die die Verarbeitung von CPUs entlasten.

In jüngster Zeit haben Speicheranbieter Flash-basierten Storage – oft unter Verwendung von QLC-Flash mit hoher Dichte – als potenziellen Allzweckspeicher propagiert, auch für Datensätze, die bisher als sekundär galten, wie beispielsweise Backup -Daten, da die Kunden nun möglicherweise mit höherer Geschwindigkeit auf sie zugreifen möchten, wenn sie KI einsetzen.

Ein angemessener Durchsatz ist ebenfalls ein Faktor, da verschiedene KI-Frameworks Daten unterschiedlich speichern, zum Beispiel zwischen PyTorch (große Anzahl kleinerer Dateien) und TensorFlow (das Gegenteil). Es geht also nicht nur darum, die Daten schnell zu den GPUs zu bringen, sondern auch in der richtigen Menge und mit den richtigen I/O-Fähigkeiten.

In den meisten Fällen bedeutet dies Flash-Speicher für niedrige Latenzzeiten beim I/O. Die erforderliche Speicherkapazität hängt von der Größe der Arbeitslasten und der wahrscheinlichen Größe der Ergebnisse der KI-Verarbeitung ab, aber Hunderte von Terabytes oder sogar Petabytes sind wahrscheinlich.

Wie wir gesehen haben, ist die massive P arallelverarbeitung mit GPUs das Herzstück der KI-Infrastruktur. Kurz gesagt, die Aufgabe des Speichers besteht darin, diese GPUs so schnell wie möglich mit Daten zu versorgen, um sicherzustellen, dass diese sehr kostspielige Hardware optimal genutzt wird.

Ist Cloud-Speicher für KI-Workloads geeignet?

Die Speicherung in der Cloud könnte für KI-Workloads eine sinnvolle Lösung sein. Der Vorteil, Daten in der Cloud zu speichern, bringt ein Element der Portabilität mit sich, da die Daten näher an ihren Verarbeitungsort verschoben werden können.

Viele KI-Projekte beginnen in der Cloud, weil man die GPUs so lange nutzen kann, wie man sie braucht. Die Cloud ist nicht billig, aber für den Einsatz von Hardware am lokalen Standort muss man sich auf ein Produktionsprojekt festgelegt haben, bevor sich der reale Nutzen erkennen lässt.

Alle wichtigen Cloud-Anbieter offerieren KI-Dienste, die von vortrainierten Modellen, APIs für Modelle, KI-/ML-Berechnungen mit skalierbarer GPU-Bereitstellung (Nvidia und eigene GPUs) bis zu einer auf mehrere Petabytes skalierbaren Speicherinfrastruktur reichen.