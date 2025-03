Bei dem Begriff generative KI denken viele Menschen an Large Language Models (LLM) wie ChatGPT von OpenAI. Obwohl LLMs ein wichtiger Bestandteil der generativen KI-Landschaft sind, sind sie nur ein Teil des Gesamtbildes.

LLMs sind eine Form generativer KI, die auf linguistische Aufgaben wie Texterstellung, Beantwortung von Fragen und Zusammenfassungen spezialisiert ist. Generative KI, eine breitere Kategorie, umfasst eine viel größere Vielfalt an Modellarchitekturen und Datentypen. Kurz gesagt sind LLMs eine Form der generativen KI, aber nicht alle generativen KI-Modelle sind LLMs.

Diese letztgenannte Einschränkung ist besonders gefährlich, da Halluzinationen bei LLMs nicht immer so offensichtlich sind wie bei anderen Arten generativer KI; die Ausgabe eines LLM kann flüssig klingen und selbst dann überzeugend wirken, wenn sie ungenau ist. Benutzer bemerken es wahrscheinlich, wenn ein Bildgenerator beispielsweise ein Bild einer Person mit acht Fingern an jeder Hand oder einer Kaffeetasse, die über einem Tisch schwebt, erzeugt, aber sie bemerken möglicherweise nicht, dass die gut geschriebene Zusammenfassung eines komplexen wissenschaftlichen Konzepts, von dem sie wenig wissen, einen sachlichen Fehler enthält.

Eine große Herausforderung ist die Komplexität von Text im Vergleich zu anderen Datentypen. Denken Sie nur an die Bandbreite der menschlichen Sprache, die online verfügbar ist: von Fachliteratur über romantische Poesie bis hin zu Instagram-Untertiteln. Ganz zu schweigen von grundlegenderen Sprachproblemen, wie dem Erlernen der Interpretation einer seltsamen Redewendung oder der Verwendung eines Wortes mit mehreren kontextabhängigen Bedeutungen. Selbst fortgeschrittene LLMs haben manchmal Schwierigkeiten, diese Feinheiten zu erfassen, was zu Halluzinationen oder unangemessenen Reaktionen führt.

Wie der Name schon sagt, werden LLMs anhand umfangreicher Sprachdatensätze trainiert. Die Daten, die zum Training von LLMs verwendet werden, stammen in der Regel aus einer Vielzahl von Quellen – von Romanen über Nachrichtenartikel bis hin zu Reddit-Beiträgen –, aber letztlich handelt es sich immer um Text. Im Gegensatz dazu können die Trainingsdaten für andere generative KI-Modelle sehr unterschiedlich sein und je nach Zweck des Modells Bilder, Audiodateien oder Videoclips umfassen.

Einige Modellarchitekturen, die für nichtsprachliche generative KI-Modelle verwendet werden, kommen jedoch nicht in LLMs zum Einsatz. Ein bemerkenswertes Beispiel sind Convolutional Neural Networks (CNNs), die hauptsächlich in der Bildverarbeitung eingesetzt werden. CNNs sind auf die Analyse von Bildern spezialisiert, um bemerkenswerte Merkmale zu erkennen, von Kanten und Texturen bis hin zu ganzen Objekten und Szenen.

Die meisten heutigen LLMs stützen sich in ihrer Kernarchitektur auf das Transformer-Modell. Durch die Verwendung von Aufmerksamkeitsmechanismen sind Transformer gut geeignet, um lange Textpassagen zu verstehen, da sie die Beziehungen zwischen Wörtern und ihre relative Bedeutung modellieren können. Transformer sind nicht nur für LLMs geeignet, sondern können auch in anderen Arten von generativen KI-Modellen, wie zum Beispiel Bildgeneratoren, verwendet werden.

Die Geschichte generativer KI und LLMs

Die derzeitige Beliebtheit von generativer KI und LLMs ist relativ neu. Beide Technologien haben sich im Laufe der Zeit erheblich weiterentwickelt.

Arten generativer KI

Die Kategorie der generativen KI umfasst mehrere Arten von Machine-Learning-Algorithmen. Zu den gängigsten gehören:

Generative Adversarial Networks (GAN). GANs wurden 2014 eingeführt und sind ML-Modelle, bei denen zwei neuronale Netze miteinander konkurrieren. Das erste Netz – der Generator – erstellt Originaldaten, während das zweite Netz – der Diskriminator – Daten empfängt und sie entweder als KI-generiert oder echt kennzeichnet. Durch den Einsatz von Deep-Learning-Methoden und einer Feedbackschleife, die den Diskriminator für jeden Fehler bestraft, lernt das GAN, wie es immer realistischere Inhalte generiert.

Die Entwicklung der LLMs

1966 debütierte der Chatbot Eliza am MIT. Eliza war zwar kein modernes Sprachmodell, aber ein frühes Beispiel für NLP: Das Programm führte einen Dialog mit den Benutzern, indem es Schlüsselwörter in ihren Eingaben in natürlicher Sprache erkannte und eine Antwort aus vorprogrammierten Antworten auswählte.

Nach dem ersten KI-Winter – dem Zeitraum zwischen 1974 und 1980, in dem die KI-Finanzierung ins Stocken geriet – erlebte das Interesse an NLP in den 1980er Jahren einen Aufschwung. Fortschritte in Bereichen wie der Part-of-Speech-Tagging und der maschinellen Übersetzung halfen Forschern, die Struktur der Sprache besser zu verstehen, und legten den Grundstein für die Entwicklung kleiner Sprachmodelle. Verbesserungen bei maschinellen Lerntechniken, GPUs und anderen KI-bezogenen Technologien in den folgenden Jahren ermöglichten es Entwicklern, komplexere Sprachmodelle zu erstellen, die auch komplexere Aufgaben bewältigen konnten.

In den 2010er Jahren wurden die Fähigkeiten generativer KI-Modelle weiter erforscht, wobei Deep Learning, GANs und Transformer die Fähigkeit generativer KI – einschließlich LLMs – zur Analyse großer Mengen von Trainingsdaten und zur Verbesserung ihrer Fähigkeiten zur Erstellung von Inhalten skalierten. Im Jahr 2018 begannen große Technologieunternehmen mit der Veröffentlichung Transformer-basierter Sprachmodelle, die große Mengen an Trainingsdaten verarbeiten konnten (daher als große Sprachmodelle bezeichnet).

Google Bert und GPT-1 von OpenAI gehörten zu den ersten LLMs. In den Jahren danach kam es zu einem LLM-Wettrüsten, bei dem seit der öffentlichen Einführung von ChatGPT Ende 2022 fast ständig Updates und neue Versionen von LLMs auf den Markt kamen.