Storage-Tipps für Artificial Intelligence und Machine Learning

Datenspeicher für den Bereich der künstlichen Intelligenz und Machine Learning bedürfen einer besonderen Planung. Lesen Sie hier, worauf Sie achten und was sie einplanen müssen.

von

Thomas Joos

Zuletzt aktualisiert:16 Apr. 2019

Die Speicherung von Daten spielt im Bereich der künstlichen Intelligenz (KI) und Machine Learning eine besonders wichtige Rolle. In diesen Bereichen werden extrem große Datenmengen gespeichert, die darüber hinaus auch schnell zugreifbar sein müssen. Ohne eine effektive und schnelle Datenverarbeitung kann kein KI- und kein ML-Projekt schnell, stabil und vor allem effektiv arbeiten. Aus diesem Grund ist die Planung eines optimalen Storage hier besonders wichtig. Es gibt verschiedene Punkte, die dabei berücksichtigt werden müssen.

Trainingsdaten müssen im KI- und ML-Umfeld so gespeichert werden können, dass diese auch in großen Datenmengen schnell abgelegt und genauso schnell wieder abgerufen werden können.

Skalierbarkeit und Preis beachten

Viele Unternehmen speichern Ihre Daten in der Cloud, wenn es darum geht, KI oder ML-Projekte effektiv zu betreiben. Ein Grund dafür ist die Skalierbarkeit. Cloud-Speicher, zum Beispiel bei Microsoft Azure oder Amazon AWS, sind schnell und einfach skalierbar und zwar nahezu ohne Grenzen. Wer eigene Enterprise-Storage-Lösungen betreibt, muss dafür sorgen, dass der lokal betriebe Speicher ebenfalls schnell und bezahlbar skalierbar ist. Das muss bereits bei der Planung der Storage-Lösung berücksichtigt werden. Auch wenn ein Datenspeicher aktuellen Ansprüchen genügt, kann sich das schnell ändern, wenn KI oder ML mehr Speicherplatz benötigen. Dann muss es möglich sein, schnell, einfach und bezahlbar Speicher nachzurüsten.

Künstliche-Intelligenz-Lösungen verarbeiten große Datenmengen in kurzer Zeit. Um ein KI- und ML-System effektiv zu betreiben, sollte das dazugehörige Storage-System unbegrenzt skalierbar sein. Modulare Speicher sind hier ideal.

Natürlich spielt hier auch der Preis eine wichtige Rolle. Denn unbegrenztes Speichervolumen ist meistens extrem teuer. Das kann dazu führen, dass ein KI- oder ML-System nicht wirtschaftlich betrieben werden kann, weil der dazugehörige Speicher zu teuer ist.

Auch der Verwaltungsaufwand der Storage-Lösung muss kalkulierbar bleiben und darf mit der wachsenden Datenmenge nicht zu sehr ansteigen.

Moderne Storage-Funktionen einsetzen – Hyperkonvergente Netzwerke und Hybrid-Einsätze berücksichtigen

Im Idealfall sollte die Storage-Lösung auch modernen Ansprüchen genügen, damit nicht die Gefahr besteht, auf veraltete Technologie zu setzen, oder in eine Sackgasse zu investieren. Vor allem softwarewarebasierte Storage-Lösungen und hyperkonvergente Umgebungen gehören zu den Technologien, die bei der Einführung von Datenspeichern berücksichtigt werden sollten. Appliances sind ebenfalls oft sinnvoll einsetzbar, da sie auch in anderen Bereichen Einsatz finden, auch für KI- und ML-Lösungen.

Viele Unternehmen scheuen sich davor, auf Cloud-Speicher oder Cloud-Funktionen zu setzen. Allerdings ist vor allem in der KI und dem ML der Einsatz von Cloud-Technologien nahezu unverzichtbar. Daher sollte die Storage-Lösung hybride Einsätze ermöglichen und im lokalen Rechenzentrum genauso funktionieren, wie bei der Anbindung an die Cloud. Durch die Unterstützung von hybriden Technologien erhalten Unternehmen daher extrem hohe Flexibilität und Skalierbarkeit.

Datensicherheit und Stabilität

Die Speichersicherheit muss ständig gewährleistet sein. Die großen Datenmengen, die durch KI und ML gespeichert werden, lassen sich in sehr seltenen Fällen sichern. Denn bei einer Sicherung erfordern diese Datenmengen natürlich auch entsprechend Sicherungsplatz auf den Sicherungsmedien. Da dieser Speicherplatz teuer und oft auch nicht verfügbar ist, verzichten viele Unternehmen darauf, diese Daten zu sichern. Auch die Dauer für die Sicherung von riesigen Datenmengen ist oft nicht mit den Sicherungsfenstern kalkulierbar. Das bedeutet aber auch, dass die Storage-Lösung, die für diese Projekte genutzt wird, ausfallsicher sein sollte und vor allem so stabil, dass möglichst keine Daten verloren gehen können. Das Storage-System sollte also möglichst selbst dafür Verantwortung tragen, seine Daten so zu speichern, dass eine Wiederherstellung möglich oder unter Umständen sogar nicht nötig sein wird.

Kompatibilität mit unterschiedlichen Protokollen und parallele Zugriffe ermöglichen

Eine Speicherlösung muss für den Einsatz in KI- und ML-Umgebungen in der Lage sein, mit mehreren Protokollen zu kommunizieren. Hier muss also sichergestellt sein, dass der Server zu allen im Unternehmen verwendeten Zugriffsarten kompatibel ist. Darüber hinaus wird auf viele Daten oft parallel zugegriffen, auch das muss der Speicher leisten können, und war performant und stabil. Es darf keine Verbindungsabbrüche geben, wenn verschiedene Speicherbereiche parallel genutzt werden.

Fazit

Storage für KI, ML und DL muss skalierbar, schnell, stabil und hochkompatibel sein. Der Speicher muss die Anbindung an die Cloud genauso unterstützen, wie den Betrieb im eigenen Rechenzentrum. Es muss sichergestellt sein, dass mit verschiedenen Protokollen ein Zugriff stattfinden kann. Natürlich muss der Speicherplatz ausreichend sein, aber dennoch kostengünstig, damit die Kosten für die Speicherung nicht den Nutzen der KI-, ML-, und DL-Lösung übersteigen. Der Datendurchsatz muss ausreichend sein, damit auch mehrere Benutzer und Dienste parallel einsetzbar sind.

Nächste Schritte

Künstliche Intelligenz bringt nachhaltige Veränderungen im Storage-Segment

Diese Risiken der künstlichen Intelligenz sollten Sie kennen

So unterscheiden sich Machine Learning und Deep Learning voneinander

Storage-Tipps für Artificial Intelligence und Machine Learning

Datenspeicher für den Bereich der künstlichen Intelligenz und Machine Learning bedürfen einer besonderen Planung. Lesen Sie hier, worauf Sie achten und was sie einplanen müssen.

Skalierbarkeit und Preis beachten

Moderne Storage-Funktionen einsetzen – Hyperkonvergente Netzwerke und Hybrid-Einsätze berücksichtigen

Datensicherheit und Stabilität

Kompatibilität mit unterschiedlichen Protokollen und parallele Zugriffe ermöglichen

Fazit

Nächste Schritte

Erfahren Sie mehr über Storage-Hardware

Storage-Anforderungen für KI-Workloads im Überblick

Cloud Storage für KI: Vor- und Nachteile und Optionen

Eröffnet die KI-Technologie Object Storage neue Marktchancen?

AIOps und Storage-Management: Funktionsweise und Tools