sabida - stock.adobe.com

Hybride KI-Architekturen in der Cloud und der Datenschutz

Hybride KI verteilt Daten über Edge, Rechenzentrum und Cloud. Nur mit Governance bleiben Herkunft, Qualität und Zugriff steuerbar. RAG steigert dabei die Verlässlichkeit.

von

Thomas Joos

Zuletzt aktualisiert: 29 Sept. 2025

Hybride KI verknüpft lokale Rechenleistung mit Cloud-Intelligenz und setzt damit einen Datenstrom in Gang, der sensible Inhalte über Regionen, Plattformen und Anwendungen hinweg transportiert. Der Nutzen ist sichtbar, die Verwundbarkeit ebenso, denn fragmentierte Landschaften, uneinheitliche Richtlinien und schwer steuerbare Workloads erzeugen Lücken, die Sicherheit, Compliance und Verlässlichkeit direkt betreffen. Dabei zählt nicht die Menge der Daten, sondern die Fähigkeit, Herkunft, Qualität und Zugriff in jeder Station der Datenreise nachzuweisen, zu begrenzen und im Zweifel hart zu unterbinden, ohne Innovation zu ersticken.

Die operative Realität zeigt ein Nebeneinander aus Edge, Rechenzentrum, Public Cloud und SaaS, das zu einer hochdynamischen Pipeline verschmilzt. Prompts, Kontextquellen, Zwischenergebnisse, Protokolle und Ausgaben bewegen sich in hoher Frequenz. Anreicherungen aus Telemetrie und Supportdaten kommen hinzu, Diagnosepakete durchqueren verschiedene Regionen, Caches behalten mehr als geplant. Ohne strenge Steuerung verfestigt sich eine gewisse Unsichtbarkeit, die nicht nur zu falschen Kennzahlen führt, sondern Betroffenenrechte gefährdet, Auditpfade zerfasert und die Haftungslage verschärft.

Retrieval-augmented Generation (RAG) und die Compliance

Retrieval-augmented Generation (RAG) verknüpft Modellantworten mit zuvor gefundenen Inhalten aus freigegebenen Quellen und verbindet Suche und Generierung in einem Ablauf. RAG beschreibt ein Verfahren, bei dem ein Sprachmodell vor der Antwort gezielt Inhalte aus freigegebenen Quellen abruft und in den Prompt einbettet. Ziel ist belastbarer Faktenbezug statt freier Halluzination.

Der Nutzen liegt in aktuellen, belegbaren Ergebnissen ohne zusätzlichen Trainingslauf und in geringerer Neigung zu Halluzinationen. Der Preis ist zusätzliche Komplexität in Indexierung, Berechtigungen und Betriebswegen. Risiken betreffen Kontextfragmente in Indizes und Caches, unbeabsichtigte Offenlegung sensibler Inhalte, Datenbewegungen zwischen Regionen und belastbare Protokollspuren.

Abbildung 1: Der Einsatz hybrider KI-Lösungen erfordert eine umfassende Umsetzung des Datenschutzes, gerade bei Umgebungen in der Cloud.

Governance-Lücken und ihr Preis

Schwache Data Governance kippt Unternehmen in Muster aus Datensilos, widersprüchlichen Kennzahlen und Werkzeugen ohne zentrale Kontrolle. Audits geraten zum Blindflug, die Nachverfolgbarkeit von Datenherkunft, Berechtigungen und Schutzmaßnahmen bleibt lückenhaft. Analysen und KI-Modelle liefern divergierende Ergebnisse, das Vertrauen bröckelt dabei, die Akzeptanz sinkt, maschinelle Entscheidungen müssen nachträglich menschlich überprüft werden. Aus operativer Sicht entstehen Reibungsverluste, die Projekte ausbremsen und Budgets verschlingen, während regulatorischer Druck zunimmt und Fristen nicht eingehalten werden.

Ein erheblicher Anteil ambitionierter KI-Vorhaben scheitert bereits jetzt an mangelhafter Datenbasis, weil Governance nachrangig behandelt wurde und Komplexität die Kontrolle überholt hat. Wo Herkunft, Qualität und Zugriff nicht konsistent belegt werden, kippen auch gute Modelle in unzuverlässige Prognosen, die in der Praxis nicht tragen. Das Ergebnis sind Störungen in Reporting-Ketten, stockende Automatisierung und eine Kultur der Kompensation, die teure Workarounds normalisiert, statt das System an der richtigen Stelle zu reparieren.

Cloud vergrößert die Regelfläche

Genau die Eigenschaften, die Cloud attraktiv machen, erschweren konsistente Steuerung. Elastische Skalierung, globale Zusammenarbeit, schnelle Bereitstellung und fließende Integration verteilen Daten dynamisch über Clouds, On-Premises und Dienstanbieter. Sichtbarkeit schwindet, Autorisierung erfolgt über verschiedene Systeme, Datenresidenz wird zur beweglichen Größe, weil niemand mehr weiß, wo einzelne Daten bereits verwendet werden und welche KI-Dienste Zugriff darauf haben oder hatten. Compliance-Teams entdecken Lücken oft erst nach aufgetauchten Problemen, Business spürt widersprüchliche Datensätze in Berichten und Forecasts, Plattformteams jagen Artefakten hinterher, die quer über Regionen verteilt wurden.

Parallel verschärfen gesetzliche Rahmen die Lage. Die DSGVO und andere Richtlinien verlangen Transparenz, Zugriffskontrolle und Nachweisfähigkeit unabhängig vom Speicherort und unabhängig davon, ob ein Modell lokal läuft oder Arbeitspakete temporär in eine Cloud verlagert. Unternehmensleitungen erwarten Echtzeiteinblicke, tragfähige Prognosen und intelligente Abläufe, doch ohne vertrauenswürdige und steuerbare Daten bleiben diese Ziele kaum umsetzbar. Risiken in transatlantischen Szenarien, Supportkanäle mit Protokolldaten, Telemetrie, die Sicherheitskriterien erfüllt und zugleich Informationssparsamkeit wahrt, all das gehört in ein konsistentes, messbares Regelwerk.

Governance als Architekturelement

Eine tragfähige Cloud Data Governance gehört in das Design. Sie verankert zentrale Sichtbarkeit über einen konsolidierten Arbeitsbereich, der Datenverkehr über Cloud, On-Premises und SaaS überwacht und steuert, und zwar so granular, dass jede Bewegung entlang von Klassifizierung, Herkunft, Qualität und Zugriff in Echtzeit bewertet werden kann. Standardisierte Regeln für Qualität, Lineage und Rollen sollten Teil der Pipeline sein, die technische Umsetzung folgt Policy als Code, wodurch Konsistenz und Rückverfolgbarkeit nicht vom Zufall abhängen.

Sicherheitsmodelle und Compliance-Vorgaben müssen in dieselben Abläufe hineinreichen, Verschlüsselung auf Transport und Ruhe genügt nicht, wenn Nutzung unkontrolliert bleibt. Konfidentielles Rechnen mit Attestierung schützt Daten, Logging folgt strikten Aufbewahrungsfristen und Redaktionsregeln, Reporting entsteht als Nebenprodukt korrekter Abläufe. Genau das senkt Risiko und beschleunigt Freigaben, weil Prüfpfade existieren, die jederzeit nachvollzogen werden können.

Abbildung 2: Bei der Verwendung von KI-Lösungen der großen Hyperscaler ist die Einhaltung des Datenschutzes ein wichtiger Faktor.

RAG als Risikofaktor in hybriden KI-Architekturen

Retrieval Augmented Generation koppelt Modellantworten an Inhalte aus freigegebenen Quellen und erzeugt zusätzliche Datenflüsse über Edge, Rechenzentrum und Cloud. Betroffen sind Vektorindizes, Caches und Betriebsprotokolle, die sensible Kontexte transportieren und replizieren. Ohne strikte Klassifizierung, Region Locks, Least Privilege auf Segmentebene, kurze Retention und nachvollziehbare Lineage vergrößert eine RAG-Pipeline die Datenschutzfläche, weil Kontextfragmente, Embeddings und Telemetrie über Systemgrenzen hinweg vorhanden sind. Genau hier setzt Governance an und erzwingt Policies als Code, deterministische Prompt Assemblies und Attestierung, damit Vertraulichkeit, Nachweisbarkeit und Modellgüte erhalten bleiben.

RAG braucht einen klaren, prüfbaren Weg von der Quelle bis zur Antwort. Ein Datenkatalog hält fest, welche Quellen zugelassen sind, in welchem Land oder welcher Region sie gespeichert sind, welche Schutzlabels gelten und wie lange Inhalte bleiben dürfen. Einträge in den Index erfolgen erst nach Freigabe. Beim Zerlegen der Dokumente werden sensible Felder vor dem Einbetten maskiert, die Maskierung läuft deterministisch, damit Duplikaterkennung und Neuaufbau stabil funktionieren. Der Vektorspeicher ist strikt nach Mandanten, Region und Projekt getrennt, Schlüssel liegen in einem HSM, Kontexte verlassen ihre Region nur nach einem zweistufigen Check auf Zweck und Rolle.

Der Retriever setzt Least Privilege pro Anfrage durch, Filter auf Dokumentlabels greifen vor der Auswahl der Top-k-Treffer, Rechte werden auf Segmentebene geprüft. Das bedeutet, der Abrufdienst nutzt für jede Abfrage nur die minimal erforderlichen Rechte und nicht das komplette Nutzerprofil. Bevor die Top-k-Kandidaten berechnet werden, werden Dokumente nach Labels wie vertraulich oder intern vorgefiltert und die Freigabe wird pro Abschnitt geprüft, nicht nur für das gesamte Dokument.

Top-k-Kandidaten sind die k relevantesten Textsegmente, die der Retriever für eine Abfrage vorläufig aus dem Index auswählt. Der Retriever ist die Suchkomponente einer RAG-Pipeline. Er nimmt die Anfrage entgegen, berechnet ein Embedding oder nutzt Schlüsselwörter, durchsucht den Index, wendet Filter und Rechteprüfungen auf Segmentebene an und liefert die geforderten Informationen mit Relevanzwerten und Quellenangaben zurück. Er selbst erzeugt keine Antwort. Der Retriever stellt nur den geprüften Kontext bereit, den das Sprachmodell anschließend für die Generierung nutzt. Typische Verfahren sind Vektorähnlichkeit mit k nearest neighbors oder termbasierte Rankings wie BM25.

Relevanz bei der Verwendung von RAG

Die Relevanz ergibt sich aus der Vektorähnlichkeit zwischen Anfrage und Segmenten. K stammt aus der Konfiguration und legt fest, wie viele Segmente in die nächsten Schritte wie Filterung und Promptaufbau gehen. Die Promptzusammenstellung folgt festen Vorlagen, sortiert und dedupliziert Kontexte und begrenzt die Nutzlast. Caches sind an Nutzer und Anfrage gebunden und verfallen schnell, eine Wiederverwendung über Benutzer hinweg ist ausgeschaltet. Telemetrie speichert nur Hashwerte zu Anfragen und Dokument IDs, keine Rohtexte, die Aufbewahrung ist kurz und freigegeben. Am Ausgang prüft ein Detektor, ob das Modell Text auswendig wiedergibt oder Zitate außerhalb des erlaubten Kontexts liefert, Antworten enthalten interne Nachweise mit IDs für Audit und Nachbau.

Im Betrieb werden Trefferquote und Genauigkeit gemessen, Fehlabrufe dokumentiert, regelmäßig Tests auf Mitgliedschaftsangriffe und Datenabfluss durchgeführt, Indexänderungen laufen nach Blue Green, damit Rücksprünge ohne Datenverlust möglich bleiben. Edge Komponenten filtern vor und korrelieren lokal, nur Embeddings zulässiger Felder gehen in die Cloud, geschützt durch kurzlebige Schlüssel und eine feste Regionsbindung. So bleibt RAG kontrollierbar und vereinbar mit Datenschutz, Nachweisbarkeit und stabiler Modellleistung.

Operative Umsetzung für hybride KI

Hybride KI verlangt harte Kanten in der Datenführung. Klassifizierung beginnt an der Quelle, nicht erst im Data Lake, sensible Inhalte erhalten Schutzobergrenzen, die jede Pipeline respektiert. RAG-Szenarien brauchen eine Redaktionsschicht für Kontextquellen, die Indizes nicht nur befüllt, sondern kuratiert und auf Berechtigungen trimmt. In hybriden Architekturen wandern dabei Passagen durch Vektorspeicher, Caches und Protokolle zwischen On-Premises und Cloud, was die Datenschutzfläche sichtbar vergrößert. Kritisch sind Quellauswahl, Berechtigungsprüfung je Anfrage, Lebensdauer der eingefügten Textteile und die Protokollierung. Tragfähige Governance erzwingt Klassifizierung der Indizes, striktes Least Privilege, eine kuratierende Redaktionsschicht für sensible Passagen, klare Lösch- und Aufbewahrungsregeln im Retrieval-Pfad sowie regelmäßige Tests gegen Modellmemorierung.

Zugriffe auf Vektorindizes und Wissensspeicher folgt dem Prinzip der geringsten Berechtigungen, Abfragen werden auf Zweckbindung geprüft. Promptinhalte, Antworten, Systemmeldungen und Zwischenschritte verbleiben nur so lange wie nötig, Protokolle entfernen Identifikatoren, Diagnosedaten werden auf das Erforderliche reduziert, und zwar technisch erzwungen, nicht organisatorisch empfohlen. Modellrisiken gehören in denselben Rahmen. Memorierung erfordert Evaluations- und Rotationskonzepte, die Trainingsdaten und Produktionsdaten sauber trennen und in definierten Abständen auf Leckagen prüfen.

Governance per Plattform

Ein Plattformansatz wie beim deutschen Unternehmen MagicTouch zeigt, wie Governance tief in die Unternehmensarchitektur einzieht und dort bleibt. Die Lösung bündelt eine Integrationsschicht, einen Data Hub sowie einen Bereich für Analytics und Governance zu einer durchgehenden Infrastruktur, in der Verbindungen zu Cloud, On-Premises und Bestandssystemen in steuerbaren Pipelines zusammenlaufen. Insellösungen verlieren dabei ihre Notwendigkeit, weil jede neue Anbindung in denselben Kontrollraum geführt wird. Der zentrale Arbeitsbereich liefert Sichtbarkeit über Flüsse und Bestände, Metriken und Ausnahmen, dadurch entsteht ein operatives Gedächtnis, das Audits nicht simuliert, sondern tatsächlich stützt.

Teams definieren Regeln für Qualität, Herkunft und Datenschutz in einer Low Code Umgebung, wodurch manuelle Pflege verschwindet und Fehlerquellen sichtbar kleiner werden. Zertifizierte Konnektoren beschleunigen die Anbindung zentraler Systeme wie ERP, CRM, EHR oder Finanzanwendungen, Governance wird dabei zum festen Bestandteil. Sicherheits- und Compliance-Kontrollen sollten bei solchen Projekten ohnehin immer eingebettet werden. Dazu kommen Verschlüsselung über Rollenmodelle bis zu Auditprotokollen und Vorgaben aus DSGVO, SOC 2 und HIPAA. Ein kontinuierliches Monitoring mit Managed Services sollte Abweichungen proaktiv erkennen, automatisiert reagieren und dort eskalieren, wo menschliche Entscheidung nötig ist.

So gelingt der Einstieg in die Umsetzung

Ein bereichsübergreifendes Kernteam bildet den Startpunkt aus Data Ownern, IT-Sicherheit, Datenschutz und Betrieb. Das Team erfasst alle Datenflüsse von der Quelle bis zur Antwort, RAG eingeschlossen, und dokumentiert Systeme, Schnittstellen, Speicherorte und Regionen. Im nächsten Schritt entsteht ein zentraler Datenkatalog, der jede Quelle vor der Aufnahme prüft und pro Eintrag Klassifizierung, Land oder Region der Speicherung, Schutzlabels und Aufbewahrungsfristen führt. Policies werden als Code gepflegt und in Build und Laufzeitpipelines verankert, Freigaben laufen über feste Prüfungen.

Region Locks begrenzen Datenbewegungen auf das Notwendige. Schlüsselmaterial wandert in ein HSM gebundenes System mit klarer Rotation. Für RAG wird der Retriever so konfiguriert, dass er vor der Auswahl der Top K Treffer nach Labels filtert und Rechte je Segment prüft, die Parameter werden versioniert. Promptvorlagen sind verbindlich, Kontexte werden sortiert und Duplikate entfernt, die Nutzlast bleibt begrenzt, Caches sind nutzerbezogen und laufen kurz. Telemetrie erfasst Hashwerte und Kennungen statt Rohtext, zentrales Logging nutzt kurze Aufbewahrungsfristen.

Eine Datenschutzfolgenabschätzung wird erstellt, Bewertungen grenzüberschreitender Übermittlungen fließen in das Änderungsmanagement ein. Der Einstieg erfolgt als Pilot in einem klar abgegrenzten Prozess, Kennzahlen für Trefferqualität und Antwortzeit stehen fest, Änderungen am Index werden im Blue Green Verfahren ausgerollt. Erst nach bestandenen Sicherheits- und Rücksprungtests folgt die breite Einführung. Zuständigkeiten und Eskalationswege sind schriftlich fixiert, Runbooks und Schulungen für Entwicklung, Betrieb und Datenschutz schließen den Start ab.