DIgilife - stock.adobe.com
Agentic RAG löst die Enterprise-Probleme klassischer RAG
Retrieval-Augmented Generation (RAG) hat sich in vielen Unternehmen als Brückentechnologie etabliert. Klassische RAG-Architekturen haben allerdings ihre Grenzen.
Zur Erinnerung: Retrieval-Augmented Generation (RAG) besteht aus drei Phasen. In der ersten ruft die KI relevante Informationen aus internen Wissensquellen ab (Retrieval). Darauf aufbauend interpretiert und strukturiert sie die Inhalte (Reasoning), bevor sie schließlich eine sprachliche Antwort generiert (Generation). Doch auch wenn alle Schritte für ein gutes Ergebnis wichtig sind, ist die Retrieval-Phase die entscheidende: Sie bestimmt, welche Informationen dem Modell überhaupt zur Verfügung stehen und definiert damit dessen „Realität“. All jene Informationen, die die KI nicht abruft, existieren für sie faktisch nicht. Daher ist nicht das formal leistungsstärkste GenAI-Modell entscheidend dafür, ob KI belastbare Antworten liefert oder nur plausible Fragmente erzeugt. Es ist vielmehr die Fähigkeit, relevante, strukturierte und kontextualisierte Informationen gezielt zu identifizieren, zusammenzuführen und zu validieren.
Unternehmen fragen sich daher: Wie lässt sich dieser Prozess in komplexen IT-Umgebungen so gestalten, dass er nicht nur technisch funktioniert, sondern auch kontrollierbar, skalierbar und auditierbar bleibt? Genau an diesem Punkt setzt Agentic RAG an. Der Ansatz erweitert traditionelle RAG-Pipelines um KI-Agenten, die Retrieval, Kontextbildung und Qualitätskontrolle aktiv orchestrieren. Parallel dazu demokratisieren No-Code-Plattformen und RAG-as-a-Service-Angebote (RAGaaS) den Zugang zu dieser Technologie.
No-Code-RAG: Mehr Zugänglichkeit, alte Vertrauensprobleme
No-Code-Plattformen senken die Einstiegshürde für den Einsatz generativer KI erheblich. Unternehmen benötigen nicht länger tiefgreifende Expertise in Sachen KI oder fachkundige Entwickler, um RAG-Systeme aufzusetzen. Über intuitive Oberflächen können sie einfache Use Cases schnell realisieren und schrittweise ausbauen.
In der Praxis zeigt sich jedoch, dass die größte Barriere gar nicht die technische Komplexität, sondern das Vertrauen in die Technologie ist. Unternehmen müssen nach wie vor sicherstellen, dass die Ausgaben der KI auch wirklich korrekt, nachvollziehbar und für den Einsatz im Live-Betrieb geeignet sind. Eine einfache Konfiguration ersetzt weder Governance noch Qualitätssicherung.
An dieser Stelle entsteht zuweilen ein Spannungsfeld zwischen Bedienbarkeit und Flexibilität. Während No-Code-Ansätze schnelle Ergebnisse ermöglichen, benötigen Unternehmensumgebungen Mechanismen für Orchestrierung, Validierung, Rollenlogik und Nachvollziehbarkeit. Moderne Lösungen bieten daher einen möglichst einfachen Einstieg, geben Nutzern aber gleichzeitig die Option, sukzessiv komplexere, agentenbasierte Workflows zu aktivieren. Auf diese Weise gewährleisten sie, dass kein Kontrollverlust stattfindet.
RAG-as-a-Service treibt Demokratisierung voran
Mit der Verfügbarkeit von RAG-Lösungen über Cloud-Marktplätze wird die Technologie breiter zugänglich. Davon profitieren besonders Bereiche mit einem hohen Anteil unstrukturierter Informationen, die einen hohen Bedarf haben, Wissen schneller und konsistent zu nutzen.
Ein typisches Einstiegsszenario ist der Einsatz von RAG in Kundenservice-Anwendungen, bei denen die KI ihre Antworten auf Produktdokumentationen, Richtlinien oder historische Fälle stützt. Zunehmend gewinnen aber auch rein interne Anwendungsfälle an Bedeutung. In Fachbereichen wie der Rechts- oder Personalabteilung sowie dem Marketing nutzen Mitarbeitende RAG-Systeme zur Unterstützung domänenspezifischer Fragestellungen. Hinzu kommen Aufgaben wie automatisierte Dokumentenklassifikation, Zusammenfassungen oder mehrsprachige Suche.
Mit der wachsenden Verbreitung von RAG steigen jedoch auch die Anforderungen im produktiven Betrieb. Agentenbasierte Funktionen erweitern die Pipeline an mehreren Stellen:
- In der Ingestion-Phase, also beim Schaffen des Datenfundaments, strukturieren und klassifizieren KI-Agenten Inhalte bis auf Absatz- oder Satzebene.
- In der Retrieval-Phase interpretieren KI-Agenten die Intentionen der User und kombinieren Informationen aus mehreren internen und externen Quellen.
Diese zusätzliche Intelligenz erhöht die Komplexität der Orchestrierung, der Qualitätssicherung und der Governance erheblich. Die Herausforderung verschiebt sich damit von der reinen Implementierung zur kontrollierten Skalierung.
Evaluierung als Rückgrat des Vertrauens
Egal, ob Unternehmen nun RAGaaS- oder No-Code-RAG-Plattformen nutzen, ein zentraler Aspekt moderner RAG-Architekturen ist die systematische Bewertung der Antwortqualität. Halluzinationen entstehen häufig durch unzureichenden oder missinterpretierten Kontext. Das kommt insbesondere in mehrsprachigen Szenarien vor, bei denen semantische Verschiebungen auftreten können. Anbieter von RAGaaS- oder No-Code-RAG-Lösungen verankern die Evaluierung daher direkt in der Architektur. Bewertet werden typischerweise drei Dimensionen:
- Kontextrelevanz: Wie gut passt der abgerufene Inhalt zur Anfrage?
- Antwortrelevanz: Spiegelt die generierte Antwort den bereitgestellten Kontext korrekt wider?
- Groundedness: Ist jede Aussage klar durch Quellen belegt?
Durch kontinuierliches Monitoring dieser Signale lassen sich Retrieval-Strategien gezielt optimieren und Qualitätslücken identifizieren. Entscheidend ist, dass diese Evaluierung nicht als nachgelagerte Prüfung, sondern als integraler Bestandteil der Pipeline verstanden wird.
Anbieter und Nutzer stehen unter Druck
Mit der Verlagerung von RAG-Funktionalitäten in SaaS-Angebote verschiebt sich für Hersteller auch der Wettbewerb. Einfache Retrieval-Funktionen gelten zunehmend als Basistechnologie. Differenzierung entsteht dort, wo Plattformen komplexe, mehrstufige Retrieval-Prozesse orchestrieren können.
Agentic RAG geht in diesem Zusammenhang über eine einmalige Kontextabfrage hinaus. KI-Agenten zerlegen komplexe Anfragen, kombinieren Inhalte aus Wissensdatenbanken, Fachsystemen oder strukturierten Datenquellen und führen mehrstufige Evidenzsammlungen durch. Das ist deswegen nötig, da heute nicht nur die Antwortqualität, sondern auch die Nachvollziehbarkeit einzelner Agentenentscheidungen immer stärker in den Fokus rückt. Für Unternehmen gewinnen Auditierbarkeit, Sicherheit, die Möglichkeit der Zugriffskontrolle und Skalierbarkeit an Bedeutung. Benutzerfreundlichkeit bleibt relevant, ist jedoch nicht mehr das alleinige Entscheidungskriterium.
![]()
„Mit der Verfügbarkeit von RAG-Lösungen über Cloud-Marktplätze wird die Technologie breiter zugänglich. Davon profitieren besonders Bereiche mit einem hohen Anteil unstrukturierter Informationen, die einen hohen Bedarf haben, Wissen schneller und konsistent zu nutzen.“
Thomas Schuller, Progress Software
Doch nicht nur die Hersteller stehen unter Druck: Angesichts der technologischen Dynamik stellt sich auch für viele Unternehmen die ultimative Frage, ob sie ein Agentic-RAG-System Marke Eigenbau erstellen können und wollen, oder ob sie auf einen Service zurückgreifen. Der Aufbau einer eigenen RAG-Architektur ist, das sollten sie bedenken, nicht nur eine reine Implementierungsaufgabe. Er erfordert langfristige Wartung, Sicherheitskonzepte und kontinuierliche Anpassungen an neue Modellgenerationen. Plattformansätze wie RAGaaS oder No-Code-RAG-Lösungen versprechen schnellere Wertschöpfung und eine kontinuierliche Weiterentwicklung entlang des Marktes.
Gleichzeitig müssen Unternehmen auf Flexibilität achten, insbesondere hinsichtlich Modellwahl, Embeddings und Deployment-Optionen. Datenhoheit, regulatorische Anforderungen und unterschiedliche Betriebsmodelle (SaaS, Hybrid, On-Premises) spielen in diesem Zusammenhang eine zentrale Rolle. Die strategische Entscheidung sollte daher nicht allein unter Kostenaspekten getroffen werden, sondern unter Berücksichtigung von Governance, Portabilität und langfristiger Innovationsfähigkeit.
Agentic RAG ist kein Hype, sondern eine sinnvolle Evolution
Agentic RAG verdeutlicht überdies, dass Modellgröße nicht automatisch zu proportional besseren Ergebnissen führt, denn in den unterschiedlichen Phasen können verschiedene Modelle hervorragende Leistung bieten. In der Ingestion-Phase können kleinere Modelle häufig ausreichende Genauigkeit bei geringeren Kosten liefern. In der Generation-Phase beeinflusst dagegen die Modellwahl zwar Stil und Ausdrucksfähigkeit, doch ohne qualitativ hochwertiges Retrieval bleibt der Mehrwert begrenzt. Unternehmen müssen daher entlang der gesamten Pipeline Trade-offs zwischen Qualität, Latenz, Tokenverbrauch und Budget berücksichtigen. Performancegewinne sind, das sei hier deutlich gesagt, nicht linear mit steigenden Modellkosten. Effizienz entsteht eher durch abgestimmte Kombinationen von Retrieval-Strategien und Modellklassen.
Die Weiterentwicklung von RAG hin zu Agentic RAG ist alles in allem kein bloßer Hype, sondern die natürliche Reaktion auf reale Business-Anforderungen: Sobald Unternehmen ihre Anwendungen von Pilotprojekten in Produktivumgebungen überführen wollen, treten unweigerlich Fragen nach Evaluierbarkeit, Governance, Skalierbarkeit und Wirtschaftlichkeit in den Vordergrund. Agentic RAG adressiert diese Herausforderungen durch intelligente Orchestrierung, kontextbewusste Informationsauswahl und integrierte Qualitätsmetriken. Damit verschiebt sich der Fokus von der reinen Generierung hin zu einer kontrollierten, transparenten Wissensverarbeitung.
Über den Autor:
Thomas Schuller ist Regional Director DACH bei Progress Software.
Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.