archy13 - stock.adobe.com

Was sind CPU, GPU, DPU und NPU?

Moderne IT-Architekturen setzen auf die Kombination spezialisierter Prozessoren. Die richtige Verteilung von Workloads optimiert die Performance und senkt die Betriebskosten.

In der IT wird der Begriff Prozessor häufig mit der CPU (Central Processing Unit) gleichgesetzt. Moderne Rechenzentren und Endgeräte nutzen jedoch bereits mehrere spezialisierte Prozessortypen. Neben CPUs spielen GPUs (Graphics Processing Units), DPUs (Data Processing Units), TPUs (Tensor Processing Units) und zunehmend auch NPUs (Neural Processing Units) eine wichtige Rolle.

Jede dieser Verarbeitungseinheiten ist auf unterschiedliche Workloads ausgelegt. Während die CPU als universelle Recheneinheit fungiert, beschleunigen GPUs parallele Berechnungen erheblich. DPUs übernehmen Infrastrukturaufgaben, TPUs spezialisierte KI-Workloads und NPUs energieeffiziente KI-Funktionen direkt auf Endgeräten.

Was ist eine CPU?

Die CPU gilt als die zentrale Recheneinheit eines Computers. Sie interpretiert und verarbeitet Befehle von Betriebssystemen und Anwendungen und koordiniert die Zusammenarbeit aller Hardwarekomponenten.

Moderne CPUs verfügen über mehrere Kerne und unterstützen die parallele Verarbeitung. Ihre Stärke liegt jedoch vor allem in der flexiblen und latenzarmen Ausführung komplexer Befehlsfolgen. Deshalb bilden sie nach wie vor das Fundament praktisch jeder IT-Infrastruktur.

Typische Einsatzgebiete sind:

  • Betriebssysteme.
  • Datenbanken.
  • Geschäftsanwendungen.
  • Virtualisierung.
  • Allgemeine Server-Workloads.

Trotz zahlreicher Beschleuniger bleibt die CPU die universelle Rechenplattform in Servern, PCs und Endgeräten.

Was ist eine GPU?

Grafikprozessoren (GPU) wurden ursprünglich entwickelt, um die Darstellung von Bildern und Videos zu beschleunigen. Ihre Architektur unterscheidet sich grundlegend von der einer CPU: Anstelle weniger leistungsfähiger Kerne verfügen GPUs über Hunderte oder Tausende Recheneinheiten, die viele Operationen gleichzeitig ausführen können.

Diese massiv parallele Architektur macht GPUs besonders geeignet für:

  • KI-Training und -Inferenz.
  • High-Performance Computing (HPC).
  • Wissenschaftliche Simulationen.
  • Big-Data-Analysen.
  • Rendering und Videobearbeitung.

Mit dem Aufstieg generativer KI haben sich GPUs zu den dominierenden Beschleunigern in modernen KI-Infrastrukturen entwickelt. Hersteller wie Nvidia, AMD und Intel bieten inzwischen spezielle Produkte für Rechenzentren und KI-Cluster an.

Was ist eine DPU?

Data Processing Units (DPU) sind auf die Verarbeitung von Datenströmen innerhalb von Rechenzentren spezialisiert. Sie kombinieren eigene Prozessorkerne mit Hardware-Beschleunigern und Hochgeschwindigkeits-Netzwerkschnittstellen und werden häufig in Form von SmartNICs implementiert.

DPUs übernehmen Aufgaben, die traditionell von der CPU ausgeführt wurden, darunter:

  • Netzwerkvirtualisierung.
  • Paketverarbeitung.
  • Verschlüsselung.
  • Speicherzugriffe.
  • Sicherheitsfunktionen.

Dadurch werden Hauptprozessoren entlastet und es stehen zusätzliche Ressourcen für Anwendungen oder virtuelle Maschinen zur Verfügung. Insbesondere Hyperscaler und Cloud-Anbieter setzen zunehmend auf DPUs, um die Effizienz großer Infrastrukturen zu steigern.

Was ist eine NPU?

Neural Processing Units (NPU) sind spezialisierte KI-Beschleuniger, die für den energieeffizienten Betrieb neuronaler Netze entwickelt wurden. Im Gegensatz zu GPUs, die vor allem in Rechenzentren und Workstations zum Einsatz kommen, sind NPUs für Endgeräte wie Notebooks, Smartphones und Tablets ausgelegt.

Sie führen KI-Aufgaben lokal aus und reduzieren dadurch sowohl die Latenzzeiten als auch den Energieverbrauch. Zudem müssen Daten nicht zwangsläufig an Cloud-Dienste übertragen werden.

Typische Einsatzgebiete sind:

  • Sprach- und Bilderkennung.
  • Live-Untertitelung und Übersetzungen.
  • Hintergrundunschärfe bei Videokonferenzen.
  • Lokale KI-Assistenten.
  • Generative KI-Funktionen auf KI-PCs.

NPUs sind mittlerweile Bestandteil vieler Prozessoren von Intel, AMD, Qualcomm und Apple. Sie gelten als Schlüsselkomponente der neuen Generation von KI-PCs und mobilen Geräten.

Heterogenes Computing wird zum Standard.

Moderne IT-Infrastrukturen basieren zunehmend auf diesem Konzept. Dabei arbeiten unterschiedliche Prozessoren zusammen, anstatt miteinander zu konkurrieren.

In einer typischen Umgebung steuert die CPU das Betriebssystem und die Anwendungen, während GPUs rechenintensive Parallelaufgaben beschleunigen. Zudem kommen zunehmend DPUs zum Einsatz, um Netzwerk-, Speicher- und Sicherheitsfunktionen von den Hauptprozessoren zu entkoppeln. Auf PCs, Smartphones und anderen Endgeräten übernehmen NPUs energieeffizient KI-Aufgaben wie Sprach- oder Bilderkennung.

Dieser Ansatz ermöglicht eine gezielte Verteilung unterschiedlicher Workloads auf die jeweils geeignete Hardware und eine effizientere Nutzung der vorhandenen Ressourcen.

Weitere KI-Beschleuniger erweitern das Spektrum

Neben CPUs, GPUs, DPUs und NPUs gibt es zahlreiche weitere KI-spezifische Beschleuniger. Dazu zählen die von Google für Deep-Learning-Workloads entwickelten Tensor Processing Units (TPU), die hauptsächlich in der Google Cloud sowie in Googles eigener Infrastruktur zum Einsatz kommen.

Darüber hinaus verwenden Hersteller und Start-ups unterschiedliche Bezeichnungen wie IPU (Intelligence Processing Unit), LPU (Language Processing Unit), HPU (Habana Processing Unit) oder RDU (Reconfigurable Dataflow Unit). Hinzu kommen kundenspezifische ASICs (Application-Specific Integrated Circuits), die von Cloud-Anbietern und Hyperscalern für das Training oder die Inferenz großer KI-Modelle entwickelt werden.

Viele dieser Architekturen verfolgen ähnliche Ziele, beispielsweise die Beschleunigung neuronaler Netze oder die Reduzierung des Energieverbrauchs, und unterscheiden sich vor allem hinsichtlich ihrer Optimierung für bestimmte Workloads. Zahlreiche Akronyme sind herstellerspezifische Bezeichnungen und haben sich bislang nicht als eigenständige Prozessorklassen etabliert.

Die Entwicklung zeigt jedoch, dass sich die Spezialisierung von Prozessorarchitekturen im Zeitalter der künstlichen Intelligenz weiter fortsetzen wird.

Fazit

CPUs bilden nach wie vor das Fundament jeder IT-Infrastruktur. GPUs dominieren KI- und HPC-Anwendungen, während DPUs Server bei Netzwerk- und Sicherheitsfunktionen entlasten. NPUs bringen KI-Funktionen schließlich direkt auf Endgeräte. Darüber hinaus entstehen weitere spezialisierte Beschleuniger, wie Googles TPUs oder kundenspezifische ASICs für bestimmte KI-Workloads. Die Zukunft der Datenverarbeitung liegt somit in heterogenen Architekturen, in denen mehrere spezialisierte Prozessortypen zusammenarbeiten.

Dieser Artikel wurde im Juni 2026 aktualisiert, um neue Entwicklungen widerzuspiegeln und das Leseerlebnis zu verbessern.

Erfahren Sie mehr über Serverhardware