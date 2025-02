Foundation Models, zu Deutsch Grundmodelle oder Basismodelle, bilden die Grundlage für die Zukunft generativer KI in Unternehmen.

Large Language Models (LLM) fallen in eine Kategorie, die als Foundation Models bezeichnet wird. Sprachmodelle nehmen Spracheingaben auf und erzeugen synthetisierte Ausgaben. Foundation Models arbeiten mit mehreren Datentypen. Sie sind multimodal, das heißt sie funktionieren auch in anderen Modi als Sprache.

Dies ermöglicht es Unternehmen, neue Verbindungen zwischen Datentypen herzustellen und das Spektrum der Aufgaben zu erweitern, für die KI eingesetzt werden kann. Als Ausgangspunkt kann ein Unternehmen Foundation Model verwenden, um benutzerdefinierte generative KI-Modelle zu erstellen, und zwar mit einem Tool wie LangChain, das über Funktionen verfügt, die auf den jeweiligen Anwendungsfall zugeschnitten sind.

Die GPT-n-Klasse (Generative Pre-Trained Transformer) von LLMs ist hierfür ein Paradebeispiel. Die Veröffentlichung leistungsstarker LLMs wie GPT-4 von OpenAI hat die Diskussion über künstliche allgemeine Intelligenz beflügelt – im Grunde genommen besagt sie, dass KI alles kann. Seit ihrer Veröffentlichung wurden zahlreiche Anwendungen auf Basis von GPTs entwickelt.

GPT-4 und andere Grundmodelle werden auf einem breiten Korpus ungelabelter Daten trainiert und können an viele Aufgaben angepasst werden.

Was ist ein Foundation Model?

Foundation Models sind ein neues Paradigma in der Entwicklung von KI-Systemen. Bisher wurde KI auf aufgabenspezifische Daten trainiert, um eine begrenzte Anzahl von Funktionen auszuführen.

Ein Foundation Model ist ein groß angelegtes maschinelles Lernmodell, das auf einem breiten Datensatz trainiert wird und für eine Vielzahl von Anwendungen und nachgelagerten Aufgaben angepasst und verfeinert werden kann. Foundation Models sind für ihre Allgemeingültigkeit und Anpassungsfähigkeit bekannt.

GPT-4, Dall-E 2 und BERT – was für Bidirectional Encoder Representations from Transformers steht – sind allesamt Foundation Models. Der Begriff wurde von Wissenschaftlern des Stanford Center for Research on Foundation Models und des Stanford Institute for Human-Centered Artificial Intelligence (HAI) in einem 2021 erschienenen Artikel mit dem Titel On the Opportunities and Risks of Foundation Models geprägt.

Die Autoren des Papers erklärten: „Während viele der ikonischen Foundation Models zum Zeitpunkt der Abfassung des Papiers Sprachmodelle sind, ist der Begriff Sprachmodell für unseren Zweck einfach zu eng gefasst: Wie wir ihn beschreiben, geht der Umfang von Foundation Models weit über die Sprache hinaus.“

Der Name Foundation Model unterstreicht laut dem Paper die grundlegende Unvollständigkeit der Modelle. Sie bilden die Grundlage für spezifische Spin-off-Modelle, die darauf trainiert sind, eine engere, spezialisiertere Reihe von Aufgaben zu erfüllen. Die Autoren des Stanford HAI-Papiers erklärten sinngemäß: „Wir haben den Begriff ‚Foundation‘ auch gewählt, um die Bedeutung von architektonischer Stabilität, Sicherheit und Schutz zu betonen: Schlecht konstruierte Fundamente sind ein Garant für Katastrophen, wohingegen gut ausgeführte Fundamente ein zuverlässiges Fundament für zukünftige Anwendungen bilden.“