flashmovie - stock.adobe.com
Infrastruktur-Modernisierung für erfolgreichen KI-Einsatz
Der Aufbau einer modernen Infrastruktur für künstliche Intelligenz bricht alte Silos auf. Die Kombination aus VMs und Containern schafft einen nachhaltigen Wettbewerbsvorteil.
In den Führungsebenen moderner Unternehmen gilt die Integration von künstlicher Intelligenz (KI) als erfolgskritischer Faktor für die langfristige Marktpräsenz. Die praktische Umsetzung stellt IT-Abteilungen jedoch vor komplexe Herausforderungen, da tiefgreifende Implementierungen erhebliche finanzielle und personelle Ressourcen binden.
Diese notwendigen Investitionen lassen sich nur schwer aufbringen, wenn die bestehende Systemlandschaft durch technische Schulden und veraltete Legacy-Strukturen blockiert ist. Die organisatorische Reibung und der gleichzeitige Innovationsdruck erfordern daher ein grundlegendes Umdenken auf Managementebene. Führungskräfte benötigen ein fundamentales Verständnis dafür, wie KI geschäftskritische Prozesse transformiert, komplizierte Arbeit aufbricht und Aufgaben präzise an Agenten sowie menschliche Fachkräfte delegiert.
Um die Relevanz dieser technologischen Entwicklung strategisch einordnen zu können, greifen Marktanalysten regelmäßig auf empirische Erhebungen in globalen Unternehmen zurück. Diese Daten verdeutlichen den immensen Handlungsdruck, unter dem IT-Entscheider weltweit stehen.
Laut der Studie The Critical Role of Storage in Building an Enterprise AI Infrastructure des Marktforschungsunternehmens Omdia betrachten 84 Prozent der Organisationen KI als wichtigen Bestandteil ihrer zukünftigen Unternehmensstrategie. Auch andere Erhebungen bestätigen diesen Trend: Laut der McKinsey-Studie The State of AI in 2025: Agents, Innovation, and Transformation setzen inzwischen 88 Prozent der Unternehmen KI in mindestens einer Geschäftsfunktion ein. Gleichzeitig befinden sich viele Organisationen noch in der Pilot- oder Experimentierphase und haben KI noch nicht unternehmensweit skaliert.
Modernisierung von Legacy-Infrastrukturen
Für die erfolgreiche Vorbereitung auf den flächendeckenden Einsatz intelligenter Anwendungen müssen IT-Leiter ihre IT-Infrastruktur konsequent neu ausrichten. Anstatt neue Workloads isoliert in Silos zu betreiben, empfiehlt sich eine Konsolidierung auf einer einheitlichen Plattform. Diese sollte klassische virtuelle Maschinen, moderne containerbasierte Anwendungen und agile Agentensysteme flexibel abbilden können. Um diesen Transformationsprozess in der Praxis strukturiert zu vollziehen, sollten Unternehmen gezielte Kernmaßnahmen priorisieren.
Zu den wichtigsten Maßnahmen gehören:
- Modernisierung bestehender Virtualisierungsumgebungen als Grundlage für hybride Plattformen aus virtuellen Maschinen (VMs) und Containern.
- Konsolidierung von Infrastruktur- und Managementwerkzeugen zur Vereinfachung des Betriebs.
- Aufbau standardisierter Plattformen für traditionelle Anwendungen, Cloud-native Workloads und KI-Anwendungen.
- Verstärkter Einsatz von Automatisierung zur Entlastung von Administratoren und Betriebsteams.
Durch die Vereinheitlichung von Betriebsprozessen können Unternehmen den Aufwand für Wartung und Administration reduzieren und gleichzeitig die Einführung neuer Technologien beschleunigen.
Eine gemeinsame Plattform für VMs und Container
Moderne Unternehmensanwendungen entstehen zunehmend als Container-Workloads auf Kubernetes-Plattformen. Gleichzeitig laufen viele geschäftskritische Systeme weiterhin in virtuellen Maschinen. Ein vollständiger Austausch dieser Anwendungen ist in vielen Unternehmen weder kurzfristig realistisch noch wirtschaftlich sinnvoll.
Aus diesem Grund setzen zahlreiche Organisationen auf Plattformen, die sowohl virtuelle Maschinen als auch Container unterstützen. Beispiele hierfür sind Red Hat OpenShift, Nutanix Kubernetes Platform (NKP) oder VMware Cloud Foundation in Verbindung mit VMware Tanzu. Solche Plattformen ermöglichen eine schrittweise Modernisierung, ohne dass bestehende Anwendungen sofort migriert werden müssen.
Parallel dazu gewinnen Open-Source-basierte Virtualisierungslösungen an Bedeutung. Insbesondere Proxmox VE wird von Unternehmen zunehmend als Alternative zu klassischen Hypervisor-Plattformen bewertet – vor allem im Mittelstand sowie in kleineren und mittleren Rechenzentrumsumgebungen. Die Lösung kombiniert KVM-basierte Virtualisierung, Container-Technologien und Cluster-Funktionen in einer einheitlichen Verwaltungsumgebung. Für Organisationen, die ihre bestehende Virtualisierungslandschaft modernisieren oder ihre Lizenzkosten reduzieren möchten, kann dieser Ansatz eine wirtschaftlich interessante Option darstellen.
Zusätzlichen Druck erzeugen die steigenden Kosten in vielen Virtualisierungsumgebungen. In einer Omdia-Befragung nannten 39 Prozent der Unternehmen zwei zentrale Reaktionen auf diese Entwicklung:
- Modernisierung von Anwendungen beschleunigen und Workloads schrittweise von virtuellen Maschinen in Container überführen.
- Wechsel auf Plattformen, die virtuelle Maschinen und Container gemeinsam verwalten können.
Für besonders leistungsintensive KI-Workloads kann der Betrieb auf Bare-Metal-Systemen darüber hinaus Vorteile bieten. Der direkte Zugriff auf Hardware-Ressourcen reduziert den Overhead der Virtualisierung und verbessert gegebenenfalls die Auslastung von GPUs. Ob ein solcher Ansatz wirtschaftlich sinnvoll ist, hängt jedoch von den jeweiligen Anforderungen und Betriebsmodellen ab.
Allerdings löst die Modernisierung der Virtualisierungsebene allein noch nicht die Anforderungen moderner KI-Infrastrukturen. Plattformen wie Proxmox VE, VMware vSphere oder Nutanix AHV sind oft die infrastrukturelle Grundlage für Unternehmensanwendungen und virtuelle Maschinen. Für produktive KI-Workloads sind jedoch in der Regel zusätzliche Plattformdienste erforderlich, beispielsweise für die Container-Orchestrierung, das GPU-Management, die automatisierte Skalierung, MLOps und die Bereitstellung von KI-Modellen. Daher setzen viele Unternehmen auf hybride Architekturen: Virtualisierungsplattformen bilden die Basis für traditionelle Workloads, während Kubernetes-Umgebungen die Ausführung moderner KI-Anwendungen übernehmen.
Kubernetes als Fundament moderner KI-Plattformen
In der Praxis etabliert sich Kubernetes zunehmend als Standard für den Betrieb produktiver KI-Umgebungen. Plattformen wie OpenShift AI, Kubeflow, Nvidia AI Enterprise, KServe oder vLLM nutzen Kubernetes als zentrale Orchestrierungsschicht für das Training, die Inferenz und die MLOps-Prozesse.
Der Grund dafür liegt in den besonderen Anforderungen moderner KI-Anwendungen. So müssen beispielsweise GPUs effizient zwischen verschiedenen Workloads verteilt werden. Modelle sollen automatisiert bereitgestellt, aktualisiert und skaliert werden. Gleichzeitig müssen Datenpipelines, Sicherheitsrichtlinien und Monitoring-Funktionen über unterschiedliche Infrastrukturumgebungen hinweg konsistent funktionieren.
Für viele Unternehmen besteht die Herausforderung deshalb nicht nur darin, ihre Virtualisierungsplattform zu modernisieren, sondern auch darin, eine Betriebsumgebung aufzubauen, in der virtuelle Maschinen, Container und KI-Workloads gemeinsam verwaltet werden können. Die Virtualisierung bildet dabei häufig das Fundament, während Kubernetes die eigentliche KI-Plattform bereitstellt.
Neue Anforderungen durch KI-Workloads
Die Modernisierung im Bereich KI geht weit über die Konsolidierung von Plattformen hinaus. Im Gegensatz zu klassischen Geschäftsanwendungen stellen KI-Modelle besondere Anforderungen an Rechenleistung, Speicher und Netzwerke.
Vor allem das Training großer Modelle erfordert leistungsfähige Beschleuniger wie GPUs, hohe Speicherbandbreiten sowie schnelle Netzwerkverbindungen zwischen Compute-, Storage- und Datenplattformen. Auch Inferenz-Workloads können erhebliche Ressourcen beanspruchen, wenn viele Nutzer gleichzeitig auf KI-Dienste zugreifen. Bei stark genutzten generativen KI-Diensten kann der kumulierte Energiebedarf der Inferenz langfristig sogar höher ausfallen als der einmalige Trainingsaufwand.
Die gestiegenen Anforderungen schlagen sich auch in der physischen Infrastruktur nieder. In spezialisierten KI-Rechenzentren und GPU-Clustern erreichen moderne Racks inzwischen Leistungsdichten von 40 bis über 200 Kilowatt. Solche Werte liegen deutlich über den typischen 10 bis 15 Kilowatt klassischer Unternehmensrechenzentren. Das erfordert neue Kühlkonzepte, da die herkömmliche Luftkühlung bei diesen Leistungsdichten häufig an ihre Grenzen stößt. Flüssigkühlung entwickelt sich daher zunehmend zum Standard in leistungsstarken KI-Infrastrukturen.
Unternehmen, die KI-Workloads im eigenen Rechenzentrum betreiben möchten, müssen diese Anforderungen bereits in der Planungsphase berücksichtigen.
Eng damit verbunden ist der steigende Energiebedarf. Laut Prognosen der Internationalen Energieagentur (IEA) wird sich der weltweite Stromverbrauch von Rechenzentren bis 2030 auf rund 945 Terawattstunden mehr als verdoppeln. KI gilt dabei als wichtigster Wachstumstreiber. Für Unternehmen werden Energieversorgung und Kühlung somit zu strategischen Planungsgrößen, die mit Netzwerk- oder Speicherkapazität vergleichbar sind.
Unternehmen müssen darüber hinaus zusätzliche Infrastrukturkomponenten berücksichtigen, darunter skalierbare Speicherplattformen für große Datenmengen.
- Datenpipelines zur Aufbereitung und Bereitstellung von Trainingsdaten sowie
- Vektordatenbanken und Retrieval-Systeme für generative KI-Anwendungen sowie
- Extrem leistungsfähige Netzwerke zwischen Rechenzentrum, Cloud und Edge-Standorten.
- Plattformen für MLOps, Modellverwaltung und Inferenzdienste.
Die Infrastruktur wird somit immer mehr zur Grundlage für die Leistungsfähigkeit und Wirtschaftlichkeit von KI-Anwendungen.
Datenqualität als Erfolgsfaktor
Neben der technischen Plattform ist vor allem die Qualität der verfügbaren Daten entscheidend für den Erfolg von KI-Projekten. Zwar verfügen viele Unternehmen über große Datenbestände, diese liegen jedoch verteilt in unterschiedlichen Systemen und Formaten vor.
Eine erfolgreiche KI-Strategie erfordert deshalb die Konsolidierung relevanter Datenquellen.
- Einheitliche Data-Governance-Richtlinien.
- Klare Datenverantwortlichkeiten.
- Mechanismen zur Sicherung von Datenqualität und Aktualität.
Denn nur wenn Modelle auf konsistenten und vertrauenswürdigen Informationen basieren, können sie zuverlässige Ergebnisse liefern.
KI-gestützte Automatisierung im IT-Betrieb
Parallel zur Modernisierung ihrer Infrastruktur nutzen viele Unternehmen bereits KI, um ihre Betriebsprozesse zu optimieren (AIOps). Laut Omdia geben 39 Prozent der IT-Administratoren an, dass mindestens die Hälfte ihrer täglichen Aufgaben inzwischen teilweise durch KI-Werkzeuge oder Copiloten unterstützt wird.
Moderne Automatisierungsplattformen bieten dafür verschiedene Funktionen:
- Analyse komplexer Systemumgebungen mithilfe kontextbezogener KI-Modelle,
- Unterstützung bei der Erstellung und Optimierung von Automatisierungsworkflows.
- Integration externer KI-Dienste über standardisierte Schnittstellen.
Außerdem gibt es visuelle Werkzeuge zur Orchestrierung von Betriebsprozessen.
In Verbindung mit etablierten Automatisierungs-Playbooks können solche Systeme Fehlerquellen schneller identifizieren, Konfigurationsprobleme erkennen und wiederkehrende Aufgaben automatisiert ausführen. Dadurch gewinnen IT-Teams Zeit für strategische Projekte und die Weiterentwicklung ihrer KI-Initiativen.
Sicherheit, Governance und digitale Souveränität
Mit dem zunehmenden Einsatz generativer KI steigen auch die Anforderungen an Sicherheit, Datenschutz und Compliance. Unternehmen müssen sicherstellen, dass sensible Informationen geschützt bleiben und regulatorische Vorgaben eingehalten werden.
Wichtige Aspekte sind:
- Zugriffskontrollen für Daten und Modelle (Role-Based Access Control, RBAC).
- Nachvollziehbarkeit von Modellentscheidungen (Explainable AI).
- Überwachung und Auditierung von KI-Systemen.
Der Schutz vertraulicher Unternehmensdaten bei der Nutzung externer KI-Dienste ist ebenfalls von großer Bedeutung.
Ein zunehmend eigenständiges Thema ist dabei die digitale Souveränität. Unternehmen – insbesondere in regulierten Branchen und im öffentlichen Sektor – stehen vor der Frage, welche KI-Workloads in externen Cloud-Umgebungen betrieben werden können und welche aus regulatorischen, organisatorischen oder sicherheitsrelevanten Gründen in eigenen Rechenzentren oder europäischen Cloud-Umgebungen verbleiben sollen.
Omdia identifiziert digitale Souveränität als eine der größten Herausforderungen bei KI-Infrastrukturprojekten. Gleichzeitig erhöhen der EU AI Act sowie Datenschutzvorgaben wie die DSGVO die Anforderungen an Transparenz, Dokumentation und Datenkontrolle. Das bedeutet für die Infrastrukturplanung, dass Fragen der Datenhaltung, der Verarbeitungsstandorte und der Zugriffsrechte von Beginn an berücksichtigt werden müssen.
Ohne geeignete Governance-Strukturen kann die Einführung von KI erhebliche Risiken für den Datenschutz, die Compliance und die Informationssicherheit mit sich bringen.
Fazit
Der Aufbau einer KI-fähigen Infrastruktur ist weit mehr als nur ein Hardware-Upgrade. Unternehmen müssen bestehende Legacy-Systeme modernisieren und Plattformen konsolidieren, während sie gleichzeitig neue Anforderungen an das Datenmanagement, die Automatisierung, die Energieversorgung und die Sicherheit erfüllen müssen.
Dabei müssen sie nicht zwangsläufig ihre gesamte Infrastruktur neu aufbauen. Oft entsteht die KI-Plattform schrittweise aus bestehenden Virtualisierungsumgebungen heraus. Open-Source-Lösungen wie Proxmox VE können ebenso Teil dieser Modernisierung sein wie etablierte Enterprise-Plattformen. Die Veränderungen im VMware-Markt haben diesen Trend zusätzlich verstärkt.
Letztlich ist entscheidend, eine Betriebsumgebung zu schaffen, die traditionelle Anwendungen, Container und KI-Workloads effizient, sicher und wirtschaftlich zusammenführt. In vielen Unternehmen wird die Virtualisierung das infrastrukturelle Fundament bilden, während Kubernetes die zentrale Plattform für KI-Anwendungen bereitstellt. Unternehmen, die darüber hinaus Datenqualität, Automatisierung, Energieplanung, Kühlkonzepte und digitale Souveränität frühzeitig berücksichtigen, schaffen die Voraussetzungen für einen nachhaltigen und produktiven KI-Einsatz.
Omdia ist ein Geschäftsbereich von Informa TechTarget. Die Analysten des Unternehmens unterhalten Geschäftsbeziehungen zu Technologieanbietern.