Nein, ChatGPT hat diesen Artikel nicht geschrieben. Aber generative KI hat in den letzten Monaten zu Recht viel Aufmerksamkeit auf sich gezogen. Das zeigen auch zwei Zahlen zum wirtschaftlichen Potential: Microsoft sagt, dass generative KI 40 Milliarden Dollar zum Umsatz des Unternehmens beitragen könnte und laut Goldman Sachs könnte generative KI die globale Wirtschaftsleistung um fast 7 Billionen Dollar steigern.

Etwa 75 Prozent der Unternehmen erwarten, dass sie in den nächsten fünf Jahren KI-Technologien einsetzen werden. ChatGPT hat in den ersten zwei Monaten über 100 Millionen Nutzer gewonnen und ist damit die am schnellsten wachsende Verbraucheranwendung aller Zeiten. Doch die besten KI-Modelle sind ohne eine Zutat nutzlos: Daten.

Unternehmen brauchen Unmengen von Daten, um KI-Modelle zu trainieren, damit sie Erkenntnisse und Werte aus bisher ungenutzten Informationen gewinnen können. Da die KI-Tools von morgen in der Lage sein werden, heute ungeahnte Erkenntnisse aus den Daten von gestern abzuleiten, sollten Unternehmen so viele Daten wie möglich aufbewahren.

Chatbots und audiovisuelle KI-Angebote werden zusätzlich große Mengen an neuen Daten erzeugen, die von Unternehmen verwaltet und gespeichert werden müssen. Schließlich werden die Schlussfolgerungen benötigt, um zukünftige Algorithmen zu trainieren. Gartner geht davon aus, dass bis 2025 der Anteil generativer KI-Daten an den gesamten, weltweit erzeugten Daten von heute einem Prozent auf zehn Prozent steigen wird. Wenn wir diese Studie mit dem Global DataSphere Forecast von IDC gegenrechnen, können wir erwarten, dass generative KI-Technologien in den nächsten fünf Jahren Zettabytes an Daten erzeugen werden.

Unternehmen können die Vorteile von KI-Anwendungen nur dann nutzen, wenn ihre Datenspeicherstrategie in großem Umfang einfache und kosteneffiziente Methoden zum Trainieren und Bereitstellen ermöglicht. Große Datensätzebenötigen entsprechende Speicherkapazitäten. Wenn Unternehmen nicht bereits in großem Umfang Daten speichern, dann sollten sie es spätestens jetzt tun.

Warum KI Daten braucht Laut IDC waren 84 Prozent der im Jahr 2022 erstellten Unternehmensdaten für Analysen nützlich, aber nur 24 Prozent davon wurden analysiert oder in Algorithmen eingespeist. Der große Anteil an verfügbaren Daten, der nicht genutzt wird, ist verlorener Geschäftswert. Es ist wie bei einem Elektroauto: Wenn die Batterie nicht aufgeladen ist, bringt das Auto Sie nicht ans Ziel. Ohne solide Datengrundlage, können auch die besten KI-Tools nicht helfen. Unternehmen, die KI-Modelle trainieren wollen, benötigen Speicherkapazität und entsprechend robuste Strategien zur Datenspeicherung, um sowohl Rohdaten als auch generierte Daten zu speichern. Für einen Teil ihrer KI-Arbeitslasten und -speicher sollten sie die Cloud nutzen, den anderen Teil jedoch vor Ort speichern und verarbeiten. Festplatten (die auch etwa 90 Prozent der Public-Cloud-Speicherkapazitäten ausmachen) sind eine kostengünstige, langlebige und zuverlässige Lösung für große Datensätze. Sie sind somit bestens geeignet, die großen Datenmengen zu speichern, die für das kontinuierliche Training von KI-Modellen benötigt werden.

Copyright-Problemen vorbeugen Auch die Aufbewahrung von Rohdaten nach ihrer Verarbeitung ist wichtig, da es wahrscheinlich zu Diskussionen über geistiges Eigentum und Copyright in Bezug auf einige von KI erstellte Inhalte kommt. So sind beispielsweise Nachfragen zur Datengrundlage von KI-Erkenntnissen denkbar. Der Nachweis der eigenen Arbeit mit gespeicherten Daten hilft dann dabei, das Copyright und die Herkunft der Erkenntnisse zu belegen. Auch die Datenqualität wirkt sich auf die Zuverlässigkeit der Erkenntnisse aus. Um eine bestmögliche Datenqualität zu gewährleisten, sollten Unternehmen Methoden wie Datenvorverarbeitung, Datenkennzeichnung, Datenerweiterung, Überwachung von Datenqualitätsmetriken, Data Governance und manuelle Überprüfung durch Experten einsetzen.