Daten sind das wichtigste Futter für künstliche Intelligenz (KI) und automatisierte Geschäftsprozesse. Doch ohne abgesicherte Prozesse sind nur wenige Anwender bereit, wertvolle Geschäftsdaten herauszurücken. Das ist eine große Chance für abgesicherte, föderative Datenräume nach Gaia-X-Vorgaben.

Den großen generativen KI-Sprachmodellen gehen die Daten aus. Denn die meisten von ihnen bedienen sich vor allem am Internet. Das bedeutet aber: irgendwann gibt es da nichts im Wesentlichen Neues und Substantielles mehr zu holen, vor allem, wenn dort immer mehr von den Sprachmodellen selbst generierter Content steht.

Gerade für die von vielen Unternehmen gewünschten vortrainierten Modelle für spezifische vertikale Märkte brauchen auch spezifische Daten. Die befinden sich aber in der Regel nicht im frei zugänglichen Internet, sondern in nicht öffentlich zugänglichen Datenräumen unzähliger Firmen. Davon, dass diese Daten zugänglich gemacht werden, hänge langfristig der sinnvolle Einsatz von KI in Unternehmen ab, meint Ulrich Ahle, CEO von Gaia-X.

Weil aber niemand dazu bereit sei, gut geschützte und geschäftswichtige Datenbestände einfach so freizugeben, brauche man eine standardisierte, rechtlich und technisch abgesicherte, vertrauenswürdige Dateninfrastruktur. Eine solche versucht Gaia-X nunmehr seit Anfang der 2020er Jahre aufzubauen.

275 Firmen und Organisationen sind Mitglied Inzwischen 275 Organisationen arbeiten weltweit an dem Vorhaben mit. Die meisten stammen aus Europa, aber mittlerweile sind auch einige außereuropäische mit von der Partie, zum Beispiel Japan, Südkorea und auch China. Die Ideen von Gaia-X scheinen also durchaus auch anderswo attraktiv zu sein. Die Umsetzung in praktisch nutzbare, ökonomisch tragfähige Projekte oder gar auf dem Markt erfolgreiche Unternehmen dagegen kam bisher eher schleppend in Gang, weshalb die Gaia-X-Gemeinde auf ihrem zweiten World Summit in Porto, Portugal, nun den Eintritt in Season 2 der Data Spaces verkündet hat. Darunter ist wohl vor allem zu verstehen, dass endlich auch funktionierende Geschäftsmodelle durch Gaia-X entstehen und sich der Nutzerkreis gravierend erweitert. Dafür muss vieles beschleunigt, automatisiert und vereinfacht werden. Gleichzeitig fordern viele Gaia-X-Beteiligte nun messbare Erfolgskriterien für Projekte und eine Vereinheitlichung der europäischen Datengesetzgebung. Genau das hat kürzlich die EU auf einer Konferenz zum Thema IT- und Datensouveränität Mitte November in Berlin versprochen. Das entsprechende Stichwort heißt Omnibus. Es bleibt zu hoffen, dass der europäische Daten-Omnibus nicht im Dickicht der Interessen steckenbleibt, wie sein verkehrstechnisches Pendant im morgendlichen Stoßverkehr oder den Datenschutz komplett aushebelt.

Herausforderung semantische Kompatibilität Ein weiteres, bislang ungelöstes Problem ist die semantische Kompatibilität unterschiedlicher Datenbestände. Heute ist es abhängig vom jeweiligen Datenraum, wie diese Kompatibilität hergestellt wird. Gibt es ein einheitliches, den Teilnehmern des Datenraums vorgegebenes Datenformat wie etwa bei Catena-X, dem inzwischen arbeitenden Datenraum der Automobilindustrie, dann müssen sich einfach alle danach richten. Dieses Modell könnte sich in Branchen durchsetzen, die ohnehin entsprechende Vorgaben machen. Ansonsten müssen sich die Teilnehmer untereinander absprechen und im Zweifel Konnektoren als Service einkaufen oder selbst entwickeln. Das verursacht Kosten und Aufwand. Um semantische Kompatibilität herzustellen, möchte Gaia-X in Zukunft möglicherweise generative KI (GenAI) einsetzen. Aus Nutzersicht wäre es sicher am einfachsten, wenn eine solche Schicht von vornherein Bestandteil von Gaia-X-konformen Infrastrukturen würde. Ein weiterer Datenraum, der demnächst operativ geht, ist Cooperants, ein Projekt für Unternehmen im Bereich Raumfahrt und -forschung. Der Datenraum geht 2026 operativ und soll einmal alle 800 deutschen und weitere Firmen aus diesen Branchen unter seinem Dach zusammenführen. Cooperants und Catena-X gehören zu den rund zwei Dutzend Gaia-X-Leuchtturm-Projekten in unterschiedlichen Realisierungsstadien. Darunter ist auch der Souvereign Cloud Stack als Basis datensouveräner europäischer Infrastrukturen. Neben den Leuchttürmen existieren laut Ahle etwa 150 weitere Projekte. Ein Großteil von ihnen befindet sich im Projekt- oder frühen PoC-Stadium.