Prompt Hacking: Die Büchse der Pandora für die Sicherheit

KI-Systeme greifen immer tiefer in Geschäftsabläufe ein. Das geht mit neuen Sicherheitsherausforderungen einher. Prompt Hacking entwickelt sich dabei zum Trendthema.

von

Tony Fergusson, Zscaler

Zuletzt aktualisiert: 13 März 2026

Die rasche Einführung künstlicher Intelligenz (KI) hat die Arbeitsweise von Unternehmen revolutioniert, Prozesse rationalisiert und Entscheidungsprozesse verbessert. Mit der Nutzung von KI-gestützten Systeme gehen jedoch neue Herausforderungen im Bereich der Sicherheit einher – beispielsweise Prompt Hacking.

Prompt Hacking ist eine ernstzunehmende Bedrohung für die Cybersicherheit, ähnlich wie SQL-Injection-Angriffe aus den frühen 2000er Jahren. Damals ermöglichten es SQL-Injektionen, auf einfache Weise schädlichen Code in Website-Formulare einzufügen, um wichtige Informationen aus den Datenbanken eines Unternehmens zu stehlen oder zu verändern. Solche Angriffe waren weit verbreitet und zeigten die Gefahr auf, wenn Unternehmen nicht sorgfältig überprüfen, was User in ihre Systeme eingeben. Die Geschichte wiederholt sich heute mit Prompt Hacking oder Prompt Injection.

In ähnlicher Weise manipulieren Malware-Akteure mit Hilfe von Prompt Hacking die Eingaben in große Sprachmodelle (LLMs) und andere KI-Systeme, um ungewünschte und potenziell schädliche Ausgaben zu erzeugen. Die einfache Ausführung von Prompt-Injektionen in Verbindung mit der weit verbreiteten Einführung von KI-Technologien macht dies zu einem Thema für die Sicherheitsverantwortlichen in Unternehmen.

Was ist Prompt Hacking?

Prompt Hacking oder Prompt-Injektionen nutzen Eingaben in natürlicher Sprache, um KI-Systeme zu manipulieren. Im Gegensatz zu herkömmlichen Code-Injektionen, die ein tiefes Verständnis der Programmierung erfordern, kann Prompt Hacking bereits mit Grundkenntnissen in der Kommunikation mit KI-Systemen umgesetzt werden. Diese niedrige Einstiegsbarriere macht es zu einem vielseitigen Werkzeug für Malware-Akteure. Im Wesentlichen nutzt Prompt Hacking die Art und Weise, wie große Sprachmodelle User-Anweisungen interpretieren. Angreifer entwickeln Prompts, die Sicherheitsvorkehrungen umgehen oder vertrauliche oder schädliche Antworten hervorrufen.

Beispielsweise wird dazu durch die Verwendung von weißen Textbausteinen für den Menschen unsichtbarer Text verwendet, der Eingabeaufforderungen enthält oder Fragen werden so formuliert, dass die KI unbeabsichtigt sensible Informationen preisgibt oder unerwünschte Aktionen ausführt. Da diese Angriffe auf der Manipulation von Sprache und nicht auf technischen Schwachstellen beruhen, können sie überraschend schwer erkennbar sein. Da KI-Systeme zunehmend in Bereichen mit sensiblen Informationen wie dem Kundenservice oder im Datenmanagement eingesetzt werden, haben Hacker ein leichtes Spiel, Daten zu erbeuten. Alleine durch die Macht der Sprache sind Unternehmen einem breiteren Spektrum an Risiken und Angriffsvektoren ausgesetzt.

Risiken für Unternehmen durch Prompt Hacking

Die Gefahren des Prompt Hacking stellen moderne Unternehmen vor erhebliche Herausforderungen und bedrohen die Betriebskontinuität. Mit sorgfältig ausgearbeiteten Prompts können böswillige Akteure KI-Systeme manipulieren, die eigentlich dazu dienen, Kunden zu unterstützen und Arbeitsabläufe zu optimieren. Beispielsweise könnte ein KI-gestützter Support-Bot dazu verleitet werden, private Daten oder Finanzdetails preiszugeben, was zu rechtlichen und Compliance-Problemen für das Unternehmen führen könnte.

Die mit Prompt Hacking verbundenen Risiken gehen jedoch über den Datenverlust hinaus. Wenn ein Angreifer Schwachstellen in einem KI-Assistenten ausnutzt, könnte er unbeabsichtigte Aktionen auslösen wie zum Beispiel das Löschen wichtiger Datenbanken, die Störung automatisierter Prozesse oder die Unterbrechung kritischer Dienste. Diese Vorfälle können zu Betriebsstörungen, finanziellen Verlusten und Unannehmlichkeiten für Mitarbeitende und Kunden führen. Darüber hinaus kann ein Verstoß erhebliche Auswirkungen auf den Ruf haben – das öffentliche Bewusstsein für Sicherheitsvorfälle kann zu Unzufriedenheit bei den Kunden, angespannten Geschäftsbeziehungen und Schwierigkeiten bei der Aufrechterhaltung des Vertrauens führen. Die Reputation des Unternehmens muss unter Umständen mit erheblichem Aufwand wiederhergestellt werden.

Da KI zunehmend in Geschäftsabläufe integriert wird, werden diese Risiken immer bedrohlicher. Systeme, die für die Gehaltsabrechnung, Finanzplanung oder Logistik zuständig sind, sind attraktive Ziele, und eine einzige ungeprüfte Eingabeaufforderung kann weitreichende Folgen haben. Für IT-Sicherheitsentscheider in Unternehmen ist es unerlässlich, diese Risiken proaktiv anzugehen, um die Resilienz der Organisation zu gewährleisten.

„Letztendlich ist der Schutz vor Prompt Hacking keine einmalige Maßnahme, sondern eine fortlaufende Verpflichtung. Durch Wachsamkeit, Anpassung an neue Bedrohungen und die Einbettung strenger Sicherheitspraktiken in den täglichen Betrieb können Unternehmen nicht nur sensible Daten und Prozesse schützen, sondern auch das Vertrauen ihrer Kunden und Partner aufrechterhalten.“

Tony Fergusson, Zscaler

Zero Trust zur Abwehr von Prompt Hacking

Wenn CISOs und IT-Teams nach adäquaten Abwehrmaßnahmen zum Verhindern von Prompt Hacking suchen, müssen sie Prompts analog zu Software oder Code betrachten. Was könnte bösartiger Code mit ihren Systemen anrichten? Die Umstellung in der Herangehensweise von IT-Teams muss darin bestehen, zu erkennen, dass es nicht nur ein singuläres Ergebnis von Prompt Hacking gibt. Sie müssen über eine Vielzahl unterschiedlicher Eingabeaufforderungen mit Schadpotenzial anstelle eines einzigen bösartigen Codes nachdenken.

Die Einführung eines Zero-Trust-Sicherheitsframeworks ist eine wirksame Methode, um diesem Problem zu begegnen. Zero Trust basiert auf dem Prinzip, dass keinem User und keinem System von vornherein Vertrauen entgegengebracht wird. Ebenso muss jede Interaktion mit KI-Systemen kontinuierlich überprüft werden. Automatisierte Tools können jede Eingabeaufforderung auf verdächtige Muster überwachen und analysieren und damit dazu beitragen, die Verarbeitung bösartiger Anweisungen zu verhindern.

Strenge Zugriffskontrollen und Richtlinien schränken die Möglichkeiten von KI-Systemen ein und legen fest, wer oder was/welches System auf sensible Funktionen zugreifen darf, sodass nur autorisierte Mitarbeitende und Arbeitsabläufe zugelassen werden. Durch kontinuierliche Verhaltensanalysen werden ungewöhnliches Systemverhalten oder Interaktionen erkannt, was zur frühzeitigen Erkennung von Prompt Injection-Versuchen beiträgt. Netzwerksegmentierung und das Prinzip der geringsten Privilegien beim Zugang auf Informationen oder Anwendungen grenzen den Zugriff auf kritische Daten und Funktionen weiter ein und verringern so das Risiko von Datenverlusten.

Regelmäßige Audits sind darüber hinaus wichtig, um die Abwehrmaßnahmen auf dem neuesten Stand zu halten. Durch die Einbettung von Zero-Trust-Prinzipien in den KI-Betrieb können Unternehmen einen stärkeren Schutz vor Prompt Hacking aufbauen und zur Datensicherheit, Betriebssicherheit und zum Ausbau des Kundenvertrauens beitragen.

Die Büchse isoliert betrachten

Prompt Hacking ist durch die Vielfalt der Sprache vergleichbar mit der Büchse der Pandora. Ist der Deckel einmal geöffnet, um Nutzen aus der Effizienz der KI zu ziehen, stellen sich leider auch Malware-Akteure ein, die ebenso von den neuen Möglichkeiten profitieren wollen und diese modernen Tools gegen Unternehmen ausspielen. Da KI-Systeme zunehmend in zentrale Geschäftsfunktionen integriert werden, nehmen die mit der Manipulation von Prompts verbundenen Risiken weiter zu. Unternehmen müssen sich bewusst sein, dass Prompt Hacking nicht nur die Sicherheit ihrer Daten gefährdet, sondern auch die Betriebsstabilität untergraben kann.

Letztendlich ist der Schutz vor Prompt Hacking keine einmalige Maßnahme, sondern eine fortlaufende Verpflichtung. Durch Wachsamkeit, Anpassung an neue Bedrohungen und die Einbettung strenger Sicherheitspraktiken in den täglichen Betrieb können Unternehmen nicht nur sensible Daten und Prozesse schützen, sondern auch das Vertrauen ihrer Kunden und Partner aufrechterhalten. Auf diese Weise sind Unternehmen besser gerüstet, um die Vorteile der KI zu nutzen und gleichzeitig die Risiken dieser sich ständig weiterentwickelnden Landschaft zu mindern. Zero Trust hilft zumindest bei der isolierten Betrachtungsweise der Büchse.

Über den Autor:
Tony Fergusson ist CISO in Residence bei Zscaler.

Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.

Prompt Hacking: Die Büchse der Pandora für die Sicherheit

KI-Systeme greifen immer tiefer in Geschäftsabläufe ein. Das geht mit neuen Sicherheitsherausforderungen einher. Prompt Hacking entwickelt sich dabei zum Trendthema.

Was ist Prompt Hacking?

Risiken für Unternehmen durch Prompt Hacking

Zero Trust zur Abwehr von Prompt Hacking

Die Büchse isoliert betrachten

Erfahren Sie mehr über Anwendungs- und Plattformsicherheit

Prompt Injection untergräbt die Kontrolle über Sprachmodelle

Leitfaden zum Risikomanagement von Large Language Models

Gängige Schwachstellen von Webanwendungen und Gegenmaßnahmen

Agent Mesh: Vom KI-Hype zur Umsetzung 2026