Google Cloud

Was Google aus Next '26 und I/O '26 nach Frankfurt brachte

Auf dem Summit fasste Google die Ankündigungen von Cloud Next '26 und I/O '26 zusammen. Agentische Infrastruktur, neue Tensor-Chips und Gemini 3.5 Flash standen im Mittelpunkt.

Zum Google Cloud Summit DACH Anfang Juni 2026 in der Messe Frankfurt brachte Google idie Neuheiten der zurückliegenden Wochen in die Region. In einem Pressebriefing fasste Dr. Wieland Holfelder, Vice President Engineering und Leiter des Google-Entwicklungszentrums in München, die Ankündigungen der beiden US-Leitveranstaltungen zusammen: der Hausmesse Google Cloud Next '26 (22. bis 24. April, Las Vegas) und der Entwicklerkonferenz Google I/O '26 (19. Mai, Mountain View).

Inhaltlich standen zwei Themenblöcke im Vordergrund. Zum einen die souveräne Cloud für Deutschland mit Zeitplan bis Ende 2026 und der Thales-Partnerschaft. Dieser Beitrag konzentriert sich allerdings auf den zweiten Block: die Ankündigungen rund um die agentische Ära, die für DACH-Unternehmen mittelfristig die größere praktische Relevanz haben dürften.

Agentische Infrastruktur: achte TPU-Generation und Cross-Cloud-Daten

Den infrastrukturellen Kern bildeten die auf der Next '26 vorgestellten Tensor Processing Units (TPUs) der achten Generation. Erstmals teilt Google seine TPU-Architektur in zwei spezialisierte Chips: Der TPU 8t ist auf das Training großer Modelle ausgelegt und liefert nach Google-Angaben annähernd die dreifache Rechenleistung pro Pod des Vorgängers; ein Superpod skaliert auf bis zu 9.600 Einheiten. Der TPU 8i ist für Inferenz und das gleichzeitige Ausführen vieler Agenten optimiert. Er verfügt über die dreifache Menge an On-Chip-SRAM, verbindet über die neue Boardfly-Topologie bis zu 1.152 TPUs in einem Pod und erreicht laut Google eine um 80 Prozent bessere Performance pro Dollar bei Inferenz-Workloads.

Ergänzt wird das Portfolio durch die nun allgemein verfügbaren ARM-basierten Axion-Prozessoren (Instanz N4A), die gegenüber vergleichbaren x86-Instanzen eine doppelt so hohe Preis-Leistung versprechen. Zudem will Google zu den ersten Anbietern gehören, die NVIDIAs Vera-Rubin-NVL72-Systeme bereitstellen. Bei Netzwerk und Speicher nannte das Unternehmen die neue Virgo Network Fabric sowie Managed Lustre mit einem Durchsatz von bis zu zehn Terabyte pro Sekunde.

Auf der Datenebene stellte Google die Agentic Data Cloud vor. Deren Herzstück ist das Cross-Cloud Lakehouse, der auf dem offenen Tabellenformat Apache Iceberg basiert. Er erlaubt es, Daten in AWS und – später im Jahr – in Microsoft Azure abzufragen, ohne sie zuvor zu Google migrieren zu müssen; Egress-Kosten und Lock-in-Effekte sollen so entfallen. Ein Knowledge Catalog soll Agenten zusätzlich mit dem semantischen Geschäftskontext eines Unternehmens grounden, damit sie zum Beispiel zwischen gebuchtem und prognostiziertem Umsatz unterscheiden können.

Gemini Enterprise Agent Platform und Agentic Defense

Als organisatorische Klammer über diese Bausteine positionierte Google Cloud auf der Next im April die Gemini Enterprise Agent Platform. Google Cloud CEO Thomas Kurian bezeichnete sie als Leitstand für das agentische Unternehmen – eine Plattform, um Agenten zu bauen, zu skalieren, zu verwalten und zu optimieren. CEO Sundar Pichai verwies auf eine Verschiebung der Fragestellung in den Unternehmen: weg von "Können wir einen Agenten bauen?" hin zu "Wie verwalten wir Tausende davon?".

Sicherheitsseitig brachte Google die Integration der erst kürzlich für 32 Milliarden US-Dollar übernommenen Cloud-Security-Plattform Wiz ins Spiel. Unter dem Stichwort Agentic Defense kombiniert der Konzern seine Threat Intelligence und Security Operations mit Wiz, ergänzt um neue, teils in der Preview befindliche Agenten zur Bedrohungssuche und zum Detection Engineering.

Von der I/O: Gemini 3.5 Flash, Spark und Antigravity

Die Modell- und Werkzeugneuheiten stammten überwiegend von der I/O '26. Zentral war der Start von Gemini 3.5 Flash, das am Keynote-Tag allgemein verfügbar gemacht wurde. Google bewirbt das vergleichsweise schlanke Modell als sein bislang stärkstes Coding- und Agentic-Modell: Es übertrifft nach Herstellerangaben das nur Monate zuvor eingeführte Flaggschiff Gemini 3.1 Pro auf Benchmarks wie Terminal-Bench 2.1 (76,2 Prozent), GDPval-AA (1656 Elo) und MCP Atlas (83,6 Prozent) und führt bei der multimodalen Verständnisaufgabe CharXiv Reasoning (84,2 Prozent). Zugleich gibt Google die Ausgabegeschwindigkeit mit dem rund Vierfachen vergleichbarer Frontier-Modelle an – in der Entwicklungsumgebung Antigravity sogar bis zum Zwölffachen. Auf der zugehörigen Folie im Briefing platzierte Google das Modell entsprechend prominent im oberen rechten Quadranten der Artificial-Analysis-Einordnung (Intelligenz versus Geschwindigkeit).

Die größere Pro-Variante verzögert sich: Pichai kündigte das Rollout von Gemini 3.5 Pro für Juli an; intern sei das Modell bereits im Einsatz. Im Enterprise-Kontext steht Gemini 3.5 Flash unter anderem über die Gemini Enterprise Agent Platform, Gemini Enterprise sowie die Gemini API in Google AI Studio bereit.

Um das Modell herum gruppiert Google mehrere Agentenprodukte, die Holfelder ebenfalls zeigte:

  • Antigravity 2.0: die überarbeitete, agentenzentrierte Entwicklungsplattform mit Desktop-App, CLI und SDK; sie unterstützt parallele Subagenten und den von Google vorgeschlagenen offenen Webstandard WebMCP.
  • Gemini Spark: ein persönlicher 24/7-Agent, der auf dedizierten Google-Cloud-VMs im Hintergrund läuft – auch bei geschlossenem Endgerät – und mit Gmail, Docs und Sheets zusammenarbeitet. Vor kritischen Aktionen holt Spark eine Bestätigung ein; der Start erfolgt zunächst über Tester und AI-Ultra-Abonnenten in den USA.
  • Managed Agents: ein API-Ansatz, bei dem ein einzelner Aufruf einen Agenten mit persistentem Zustand in einer isolierten, Google-gehosteten Linux-Umgebung startet.
  • Gemini Omni: ein multimodales Modell zur Erzeugung und Bearbeitung von Videoinhalten aus Text-, Bild-, Audio- und Videoeingaben.

Zur Einordnung der Dynamik nannte Google zudem Plattform-Kennzahlen: Die Gemini-App komme inzwischen auf über 900 Millionen monatlich aktive Nutzer, und der Konzern verarbeite über drei Billiarden Token pro Monat.

Was das für DACH-Kunden bedeutet

Für die DACH-Region untermauerte Google die Botschaft mit Referenzen. Prominentestes Beispiel war die Robert Bosch GmbH, die laut den Angaben auf dem Summit 120.000 Lizenzen für Gemini Enterprise erworben und die Plattform nach einem siebenmonatigen Test mit mehreren tausend Power Usern für die gesamte Belegschaft ausgerollt hat – betrieben auf Google Cloud, auch aus Gründen von Datenresidenz und Compliance. Als weitere Kunden in der Region nannte Google Mercedes-Benz und Otto. Seine Infrastrukturinvestitionen in Deutschland beziffert der Konzern auf 5,5 Milliarden Euro bis 2029.

Realistisch blieb Google bei der Verfügbarkeit von Rechenkapazität: Karthik Narain, Chief Product and Business Officer von Google Cloud, räumte ein, dass die Nachfrage das Angebot übersteige. Bestehende Enterprise-Zusagen würden priorisiert, neue Commitments geprüft – ein Hinweis, den Planer in regulierten Branchen einkalkulieren sollten.

Den Bogen zur Souveränität schlug Google über die API-Kompatibilität seiner Stufen – von der Public Cloud über Data Boundary und das partnerbetriebene Google Cloud Dedicated bis zur Air-Gapped-Variante. Unter dem Motto „Develop once, deploy everywhere“ sollen Anwendungen in der Public Cloud entstehen und anschließend in eine souveräne Stufe migriert werden. Damit verbindet der Konzern die beiden Summit-Stränge: Die agentischen Bausteine aus Next '26 und der I/O sind das Angebot, das er nun auch in die regulierten Umgebungen des DACH-Marktes tragen will.

Über die Autoren:
Prof. Dr. Jonas Härtfelder ist Professor für Betriebliche Anwendungen, Entrepreneurship/Unternehmensführung und Projektmanagement an der Hochschule Ansbach.

 

Prof. Dr. Jens-Henrik Söldner ist Professor für IT-Sicherheit und Wirtschaftsinformatik an der Hochschule Ansbach sowie Geschäftsführer der Söldner Consult GmbH in Nürnberg. Nach seinem Diplom in Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg (2003) promovierte er ebenda am Lehrstuhl für Wirtschaftsinformatik 1 (Dr. rer. pol., 2017).

Erfahren Sie mehr über Cloud Computing