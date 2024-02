Der Hype um generative künstliche Intelligenz hält den Markt in Atem und hat Auswirkungen auf alle Branchen und Lebensbereiche. Zahlreiche Unternehmen versprechen sich vom Einsatz generativer KI Leistungseffizienz und Wachstumschancen. Für Entwickler generativer KI ist die aktuelle Situation ein zweischneidiges Schwert: zum einen lässt sich als KI-Experte ein gutes Einkommen erzielen, zum anderen stehen die Entwickler unter hohem Druck, die KI-Lösungen schnellstmöglich voranzutreiben und leistungsfähiger und zuverlässiger zu machen.

Bei aller Begeisterung um diese Technologie zeichnet sich bereits jetzt ab, dass sie einen Preis hat. Dabei geht es nicht nur um die Kosten, die für die Nutzung, sondern auch um alle damit verbundenen Ressourcen, die es zu finanzieren gilt. In diesem Beitrag beleuchten wir einige der Kosten, die durch generative Intelligenz anfallen und nicht unbedingt offensichtlich sind.

Es sollte allerdings zunächst erwähnt werden, dass es keine generellen Angaben zu den Gesamtkosten geben kann, das diese enorm von den hier aufgeführten Kriterien abhängen. Unterschiedliche Quellen erheben durchschnittliche Kosten, die extrem voneinander abweichen. Das Unternehmen Akkio gibt Implementierungskosten von 25 US-Dollar pro Monat an, während die Decode-Agentur für eine individuelle KI-App-Entwicklung zwischen 6.000 und 500.000 US-Dollar zusammenrechnet. Andere Fachleute sehen die durchschnittlichen Kosten bei 50.000 bis 100.000 Euro (startup-creator.com) für die Entwicklung. Allerdings endet die Rechnung nicht bei der Entwicklung, sondern inkludiert weitere Faktoren wie Wartung, Training, Hosting und Bereitstellung.

Die offensichtlichen Kosten für KI-Anwendungen sind die, die für die reine Nutzung der Lösung anfallen. Es gibt zwar zahlreiche kostenfreie Versionen – auch ChatGPT und Perplexity und zahlreiche andere Anbieter offerieren gratis Varianten als Einstiegsoption – für Nutzer, allerdings verfügen die Kaufversionen meist über einen höhere Funktions- oder Leistungsumfang. ChatGPT Plus beispielsweise gibt seinen Kunden schnellere Reaktionszeiten. Mit Copilot von Microsoft können Anwender innerhalb der Microsoft-365 -Suite Anfragen stellen; die Lösung nutzt für ihren Output alle verfügbaren Daten in MS365 und erstellt einen so genannten semantischen Index. Andere Lösungen wie ChatSonic erlauben nur eine begrenzte Anzahl an Abfragen pro Monat, für zusätzliche Aufrufe muss der Nutzer bezahlen. Der Programmierbot von GitHub ist generell für alle Nutzer kostenpflichtig, ausgenommen für verifizierte Studenten und Lehrkräfte sowie Admins von populären Repositories bei GitHub selbst.

Für die Eigenentwicklung eines KI-Prototypen gibt Kobold.ai 15.200 Euro an, die sich aus insgesamt 304 Stunden an Arbeitszeit verschiedener Experten ergeben, bei einem durchschnittlichen Stundenlohn von 50 Euro. Die Kosten bei einer Fremdentwicklung sieht das KI-Unternehmen bei 32.200 Euro in Zusammenarbeit mit internen Fachkräften. Die günstigste Option sieht die Firma in der Nutzung von Self-Service-KI-Produkten, bei der die Kosten laut der Berechnung bei nur 4.000 Euro liegen können. Die vollständigen Berechnungsbeispiele lassen sich hier nachlesen. Eine Übersicht für die Kostenzusammensetzung von Chatbots finden Sie beim Anbieter Moin.ai .

Unabhängig davon, wer die KI-Anwendung entwickelt, können Softwarekosten anfallen, da oft vorhandene Modelle genutzt werden, beispielsweise ChatGPT oder Gemini. Diese Kosten werden oft unterschätzt oder gar übersehen, obwohl sie durchaus signifikant sein können. So müssen die Daten oft kategorisiert und entsprechend für Trainingszwecke gekennzeichnet – oft mit manuellem Einsatz (mehr zu diesen Kosten im Kapitel Fachkräfte) – und bereinigt, organisiert und vorverarbeitet werden, was ebenso Software erforderlich macht. Je umfassender und komplexer das Data Set, desto höher die Softwarekosten.

Oft ist das Testen verfügbarere KI-Tools für viele Unternehmen erst der Anfang der eigenen KI-Geschichte. In zahlreichen Fällen kristallisiert sich heraus, dass eine eigene Anwendung sinnvoller wäre, was bedeutet, dass diese für den spezifischen Anwendungsfall entwickelt werden muss, entweder vom Unternehmen selbst, mit Self-Service -KI-Produkten oder von einem externen Dienstleister. Das wiederum heißt, dass zusätzlich zu bereits angefallenen Nutzungskosten verschiedener KI-Modelle Entwicklungskosten anfallen, deren Höhe von unterschiedlichen Parametern abhängt.

Das sind aber nicht die einzigen Kostenfaktoren im Speicherbereich. KI-Anwendungen stellen auch andere Herausforderungen an die Backup -Prozesse, was eventuell bedeutet, neue Backup-Software anschaffen zu müssen. Hinzukommen Kostenüberlegungen für Cloud-Storage -Dienste und Archivspeicher . Letzterer könnte durch KI-Anwendungen einen Anstieg an Archivdaten erfahren, da diese historischen Daten zu einem späteren Zeitpunkt erneut genutzt werden können.

Weitere Komponenten, die den Preis einer Gesamtlösung beeinflussen, sind ASICs und FPGAs. Auch sie dienen der Prozessbeschleunigung. Field Programmable Gate Arrays (FPGAs) sind integrierte Schaltungen mit einer programmierbaren Hardwarestruktur. Sie können unterschiedliche Aufgaben durchführen, für die sie sich individuell umprogrammieren lassen. Application-Specific Integrated Cicuits (ASICs) – zu deutsch Anwendungsspezifische integrierte Schaltungen – sind für eine bestimmte Funktion konzipiert und können nicht umprogrammiert werden. Es gibt strukturierte und zellenbasierte ASICs, wobei ein strukturierter ASIC ein Zwischenschritt zwischen FPGAs und zellenbasierten ASICs ist. Diese Komponenten können in der KI-Infrastruktur einen Unterschied machen. Die Kosten für FPGAs variieren stark, je nach Leistungsportfolio und können zwischen 250 und 1.500 Euro liegen. Das Gleiche gilt für ASICs, die verhältnismäßig günstig ausfallen können, vor allem wenn sie in hohen Stückpreisen erworben werden. Für die meisten Unternehmen spielt dies aber kaum eine Rolle, da diese Elemente bereits in vorgefertigten Lösungen vorhanden sind. Trotzdem ist es wichtig für IT-Entscheider zu verstehen, welche Teile der KI-Infrastruktur die Kosten treiben können.

Ein weiteres Puzzlestück in der KI-Infrastruktur sind Neural Processing Units (NPU). Diese kommen zum Beispiel in der Intel Core CPU-Serie oder den AMD Ryzen 8040-Prozessoren zum Einsatz. Sie sind ausschließlich für neuronale Netzwerkberechnungen konzipiert. Diese Chips sind auf die Beschleunigung bestimmter KI-Aufgaben zugeschnitten und bieten Effizienzgewinne in Bereichen wie Bilderkennung und Verarbeitung natürlicher Sprache. Sie sind auch als Beschleuniger maschinellen Lernens und des Deep Learning bekannt. Sie sind in den meisten Fällen bereits in Lösungen integriert. Anwender sollten bei der Anschaffung ihrer Prozessoren nachfragen, ob TPUs oder NPUs als Beschleuniger Teil der Lösung sind.

Neuere GPUs sind oft mit so genannten Tensor Processing Units (TPUs) ausgestattet. Tensor Processing Units (TPUs) sind Googles maßgeschneiderte Lösung für die Berechnungsanforderungen der KI. TPUs wurden speziell für das maschinelle Lernen mit neuronalen Netzwerken entwickelt und sind für Tensor-Berechnungen optimiert, die grundlegende Mathematik hinter vielen KI-Operationen. Das Unternehmen bietet TPU-Leistung auch als Cloud-Service an, für die Region europe-west4 bezahlen Cloud-Nutzer beispielsweise 1,386 US-Dollar pro Chipstunde bei einem Jahresabonnement oder 2,2000 US-Dollar bei Bedarfsnutzung.

GPUs sind Grafikkarten , die für das Training neuraler Netzwerke essenziell sind, da sie mit ihrer Architektur Die Anforderungen des maschinellen Lernens an parallele Verarbeitung bedienen. In diesem Markt kommt der Anwender um NVIDIA nicht herum. Ein Modell der NVIDI A100 Tensor Core GPU kostet rund 17.000 Euro, aber der Preis kann je nach Modell auf bis zu 50.000 Euro klettern. Für die NVIDIA H100 Tensor Core (80 GB, PCIe 5.0, Bandbreite 2 TB/s, 350 Watt, 14592 Kerne) bezahlen Anwender rund 30.000 Euro

CPUs verarbeiten Daten sequenziell und gehören zum Kern eines Systems. Bei CPUs sind Intel und AMD die Platzhirsche und lassen sich die KI-optimierten Prozessoren einiges kosten. So schlagen die verschiedenen CPUs der Xeon Max Series mit Preisen von 11.000 bis über 16.000 Euro zu Buche. Für die Platinum-Serie verlangt der Hersteller zwischen 7.500 und 13.000 Euro. Im gleichen Segment positioniert sich AMD mit den Threadripper-Pro-Produkten, die zwischen 10.000 und 12.000 Euro kosten. AMD kündigte Ende 2023 neue Prozessoren an, die AMD Radeon Instinct MI300X und AMD Radeon Instinct MI300A. Derzeit sind dafür noch keine Preise bekannt, aber auch diese CPUs werden sicher im hochpreisigen Segment liegen. Microsoft kündigte ebenso im Jahr 2023 an, eigene Prozessoren für KI-Umgebungen fertigen zu wollen. Das Produkt Maia 100 soll vor allem die Abhängigkeit des Unternehmens von den CPU-Herstellern zu beenden. Microsoft geht es hier weniger darum, die CPUs einzeln zu verkaufen, sondern sie vielmehr als Teil ihrer Cloud-Infrastruktur den Kunden zur Verfügung zu stellen. Auch diese Infrastrukturen werden dann entsprechend bepreist werden. Aus diesem Grund sind auch keine konkreten Preise verfügbar.

Obwohl viele Unternehmen sicherlich vollständige Systeme für ihre KI-Umgebung bereitstellen, lohnt es sich einen Blick auf einzelne Komponenten zu lenken, um die Preisdynamik zu verstehen. In einigen Fällen kann es sich darüber hinaus empfehlen, einzelne Elemente eines Systems auszutauschen, um die Leistung zu optimieren. Hardware-Hersteller haben relativ schnell auf den KI-Hype reagiert und bieten entsprechend leistungsstarke Produkte an.

KI-Anwendungen sind leistungshungrig und stellen entsprechende Anforderungen an die IT-Umgebung. Zu den entscheidenden Komponenten, auf die es in einer Hardwareumgebung für KI ankommt, gehören:

Obwohl KI-Anwendungen Softwarelösungen sind, fallen auch Kosten für passende Hardware an, denn in den meisten Fällen stoßen die vorhandenen Hardwaresysteme bei langfristigem Einsatz der KI-App(s) an ihre Grenzen. IT-Entscheider müssen vor der Implementierung ihrer KI-Anwendung prüfen, ob die Hardware die Anforderungen bedienen kann und falls nicht, welche notwendigen Erweiterungen hinzugefügt werden müssen. In manchen Fällen kann auch ein Austausch oder eine Neuanschaffung von Hardwarekomponenten erforderlich sein.

Strom, Kühlung und Emissionen

Derzeit gibt es noch keine wirklich belastbaren Zahlen, wenn es um die Stromkosten für künstliche Intelligenz geht. Es gibt einige Schätzungen und verfügbare Zahlen, mit denen sich ungefähre Kosten errechnen lassen. Laut Google verbraucht eine Google-Anfrage beispielsweise 0,3 Wattstunden. Dr. Dieter Kranzlmüller vom Institut für Informatik gibt den Stromverbrauch für eine ChatGPT-Anfrage mit 6,8 Wattstunden an, allgemeine Einschätzungen sehen den Stromverbrauch für eine KI-Anfrage bei zwischen 3 und 9 Wattstunden. IT-Anbieter Google schätzt, dass KI rund 10 bis 15 Prozent ihres Stromverbrauchs ausmacht, was pro Jahr etwa 2,3 Terawattstunden ausmacht. Es existieren weitere Prognosen, die den weltweiten Stromverbrauch von KI-Systemen bei 80 Terawattstunden im Jahr schätzen. Das entspricht dem jährlichen Energiebedarf von Ländern wie Holland, Schweden oder Argentinien.

Der Ökonom und Doktorand Alex de Vries wird derzeit häufig mit seiner Aussage zitiert, dass Google-Anfragen weitaus mehr Strom benötigen, wenn sie ausschließlich KI verwenden. Bei 9 Milliarden Anfragen pro Tag würde dies in rund 30 Terawattstunden pro Jahr resultieren. Dies wiederum ist der Energiebedarf Irlands. Darüber hinaus schätzt de Vries, dass große Sprachmodelle wie GPT-3, Gopher oder Open Pretrained Transformer 1.287, 1.066 beziehungsweise 324 Megawattstunden für das Training ihrer Anwendungen benötigen. Setzen sich also immer mehr KI-Anwendungen in den Rechenzentren durch, kann dies laut Hasso-Plattner-Institut dazu führen, dass Rechenzentren weltweit 30 Prozent des globalen Stromverbrauchs für sich beanspruchen. Derzeit liegt der Wert bei zwischen 4 und 5 Prozent, Laptops und Smartphones nicht mitgerechnet.

Laut einer Studie des Herstellers Pure Storage sind die meisten Unternehmen nicht auf die großen Energiebedarfe durch KI vorbereitet. In der Studie sagten 88 Prozent der Befragten, dass die Integration künstlicher Intelligenz den Stromverbrauch in die Höhe schnellen ließ: Fast die Hälfte dieser Anwender verzeichneten eine Verdopplung des Energiebedarfs. Demgegenüber stehen 73 Prozent der Umfrageteilnehmer, die mit diesen Anforderungen nicht gerechnet hatten. Dementsprechend planen nun 96 Prozent der befragten IT-Verantwortlichen, ihre Infrastruktur zu aktualisieren. Mit den explodierenden Energieanforderungen sehen sich die Firmen weiter unter Druck gesetzt, da dies die Nachhaltigkeitsziele beeinträchtigt.

Bei diesen Betrachtungen geht es meist um den Stromverbrauch, der für Trainingszwecke benötigt wird. Diese Perspektive ist allerdings zu kurz gefasst, denn KI-Apps verbrauchen auch nach dem Training, also bei der täglichen Nutzung, Strom. Laut einer Untersuchung von SemiAnalysis werden für den Betrieb von Chat-GPT in der Inferenzphase 3.617 Server gebraucht, die 28.936 Grafikprozessoren umfassen. Das entspricht einem täglichen Energiebedarf von 564 Megawattstunden. Für das Training von GPT-3 waren insgesamt 1.287 Megawattstunden nötig.

Wer die Rechnung selber machen möchte, muss unter anderem wissen, wie viele Grafikkarten und CPUs für die KI zum Einsatz kommen. Im Schnitt verbrauchen GPUs bis zu 350 Watt, CPUs zwischen 150 und 200 Watt. Darüber hinaus benötigen diese Komponenten auch im Ruhezustand (Idle) Strom, Grafikkarten beispielsweise zwischen 4,2 und 78,6 Watt.

Strom ist nicht der einzige Faktor, der bei den KI-Kosten zubuche schlägt; auch Wasser muss in die Kostenrechnung mit einfließen. Forscher der Universität von Texas haben hierzu eine Studie angefertigt, um auf die versteckten Kosten von KI-Umgebungen hinzuweisen. Ihrer Einschätzung nach verbraucht ChatGPT einen halben Liter Wasser pro Gespräch, das Training des Modells verlangte etwa 700.000 Liter Wasser. Supercomputer wie der von OpenAI, der aus 10.000 Grafikkarten und 285.000 Prozessorkernen besteht, wird somit neben Stromkosten auch den Kühlungsbedarf vergrößern, wofür vor allem auch Wasser zum Einsatz kommt. Oft handelt es sich um Trinkwasser, das verwendet wird, um Korrosion und Bakterien bei den Systemen zu vermeiden. Es wird erwartet, dass neuere KI-Modelle noch mehr Wasser benötigen.

Ein weiterer Faktor, der auf den ersten Blick zwar keine Kosten erzeugt, auf den zweiten Blick aber problematisch werden kann, sind die Emissionen, die mit dem Einsatz von KI-Anwendungen einhergehen. So schätzt die US-Forscherin Emma Strubel in einer Abhandlung, dass das Training von Sprachmodellen ungefähr so viel CO 2 ausstößt, wie fünf Verbrennerautos oder zwei Drittel dessen, was ein Mensch in seiner Lebenszeit verursacht. Laut den Einschätzungen von Wissenschaftlern der Berkeley-Universität kommt GPT-3 von OpenAI auf 552 Tonnen an Emissionen. Eine erste Version des Bildgenerators Stable Diffusion wurde 200.000 Stunden lang in Amazons AWS-Rechenzentren trainiert und soll dabei 15 Tonnen CO2-Äquivalent erzeugt haben. Das Unternehmen Hugging Face veröffentlichte unlängst nicht nur den Energieverbrauch des eigenen Sprachmodells BLOOM. Laut ihren Schätzungen stieß das Training des Modells 25 Tonnen CO2 in die Luft, 50 Tonnen, wenn man die Herstellung der Komponenten und der dahinterliegenden Computer-Infrastruktur mitrechnet.

Es gibt Schätzungen, dass der weltweite IT-Sektor derzeit für 2 bis 4 Prozent der Treibhausgasemissionen verantwortlich ist. Momentan nehmen KI-Anwendungen hier nur einen geringen Anteil ein, aber hier ist mit einem weiteren Anstieg zu rechnen und dies könnte langfristig auch zusätzliche Kosten für Firmen erzeugen. Die Debatte um Klimaerwärmung und wie man dieser entgegenwirken kann ist in vollem Gange und es werden Regularien wie eine CO2-Steuer oder europäische Regeln in Erwägung gezogen. Unternehmen, die sich dann nicht an Emissionsvorgaben halten, sehen sich dann Strafgeldern gegenüber.