In der schnelllebigen Welt des Handels ist es unerlässlich, mit den neuesten Trends und Technologien Schritt zu halten. Künstliche Intelligenz (KI) heißt das neue Zauberwort, denn sie verspricht Lösungen für nahezu alle Herausforderungen, mit denen der Handel heute konfrontiert ist: Steigende Kundenerwartungen, verschwimmende Grenzen zwischen physischem und digitalem Einkauf und ein harter Wettbewerb, in dem Schnelligkeit und Effizienz zu entscheidenden Erfolgsfaktoren werden.

Im Bereich der künstlichen Intelligenz und des maschinellen Lernens sind Large Language Models (LLMs) eine bahnbrechende Entwicklung, die den Zugang zu den fortschrittlichsten KI-Anwendungen einfacher denn je macht.

Fast täglich kommen neue Use Cases hinzu, und es besteht kein Zweifel daran, dass die strategische Integration von LLMs Retailer in einem sich ständig weiterentwickelnden Markt für nachhaltiges Wachstum und Wettbewerbsvorteile positioniert.

Zum einen sind LLMs die treibende Kraft hinter leistungsfähigen Chatbots und virtuellen Assistenten, die rund um die Uhr sofortigen Kunden-Support bieten. Diese Systeme können ein breites Spektrum von Anfragen bearbeiten, von Produktempfehlungen bis hin zur Fehlerbehebung, und so die Customer Experience verbessern. Auf der Grundlage von Kundendaten können LLMs hochgradig personalisierte Produktempfehlungen abgeben sowie die Tonalität der Kommunikation an das Profil des Kunden anpassen und so die Kundenbindung und Markentreue verbessern. Durch die Analyse des Kunden-Feedbacks verfeinern LLMs kontinuierlich ihr Verständnis der Kundenpräferenzen, was zu einer immer genaueren Personalisierung führt.

Large Language Models: Open Source versus Proprietär

Bei der Auswahl eines LLMs stellt sich für Retailer zwangsläufig die Frage: Open Source oder proprietäres Modell?

Große proprietäre LLMs werden mit einer so umfangreichen Daten- und Wissensbasis trainiert, dass sie hervorragende Generalisten und damit für viele Anwendungsfälle gut genug sind. Aber ihnen fehlt das Wissen über das spezifische Unternehmen und seine Anforderungen. In diesem Fall können mit Prompt Engineering und Few-Shot-Learning brauchbare Ergebnisse erzielt werden. Unter Few-Shot-Learning versteht man die Möglichkeit, das Modell mit einer kleinen Menge von Trainingsdaten schnell an neue Aufgaben anzupassen. Beim Prompt Engineering geht es darum, den Output des Modells besser an die eigenen Erwartungen anzupassen, indem der Input, das heißt der Prompt, so formuliert wird, dass alle Erwartungen explizit kommuniziert werden. Jeder Prompt hat ein Context Window. Dieses Context Window bezeichnet die Menge an Tokens, die ein Prompt inklusive Antwort maximal enthalten darf und ist je nach Modell unterschiedlich groß. Es sollte so groß wie möglich sein, um zum Beispiel einen Chatbot auf einer Website sinnvoll nutzen zu können.

Wenn jedoch die Wissensbasis erweitert werden soll, kann das Context Window zu klein sein. In diesem Fall ist Finetuning eine Alternative. Allerdings unterstützen große, proprietäre Modelle wie GPT-4 kein Finetuning, so dass man abwägen muss, ob ein großes Modell mit Unterstützung von Prompt Engineering die besten Ergebnisse liefern kann oder ob es besser ist, ein kleineres, frei verfügbares Modell zu trainieren, um den Output genauer an die eigenen Anforderungen anzupassen. Hierfür eignen sich Open-Source-Modelle, die gezielt für eigene Anwendungsfälle und mit eigenen Daten trainiert werden können.

Da aber die großen proprietären Modelle ihr Context Window immer weiter ausdehnen, wird das Finetuning beim derzeitigen Entwicklungstempo vielleicht bald gar nicht mehr nötig sein, weil so viele Daten in Echtzeit eingespeist werden können, dass es überflüssig wird, kleinere Modelle dediziert an eigenen Daten zu trainieren oder zu finetunen.

Wie sehen also die Szenarien für Unternehmen aus, speziell im Retail-Bereich?