Auf großen Sprachmodellen basierende Assistenten wie GitHub Copilot und Amazon CodeWhisperer haben die Softwareentwicklungslandschaft revolutioniert. Diese KI-Tools steigern die Produktivität dramatisch, indem sie Standardcode generieren, komplexe Algorithmen vorschlagen und unbekannte Codebasen erklären. Eine Studie des digitalen Beratungsunternehmens Publicis Sapient hat ergeben, dass Teams durch den Einsatz von KI-generiertem Code bis zu 50 Prozent der Nettoentwicklungszeit einsparen können.

Mit der Einbindung von KI-gestützten Generatoren in die Entwicklungsabläufe ergeben sich jedoch auch Sicherheitsbedenken. Beachten Sie Folgendes:

Im Folgenden werden die Sicherheitsrisiken von KI-generiertem Code für DevSecOps-Teams beleuchtet und es wird erläutert, wie Anwendungssicherheitsteams (AppSec) sicherstellen können, dass der verwendete Code keine Schwachstellen enthält.

Die Sicherheitsrisiken von KI-generiertem Code

Im Februar 2025 beschrieb Andrej Karpathy, ein ehemaliger Forscher und Gründungsmitglied von OpenAI, eine „neue Art des Programmierens ... bei der man sich ganz den Vibes hingibt, den Fortschritt begrüßt umarmt und vergisst, dass der Code überhaupt existiert“. Diese augenzwinkernde Aussage über Vibe Coding führte zu einer Flut von Kommentaren von Cybersicherheitsexperten, die sich besorgt über den potenziellen Anstieg anfälliger Software aufgrund der unkontrollierten Verwendung von Programmierassistenten auf der Grundlage großer Sprachmodelle (LLMs) äußerten.

Zu den fünf Sicherheitsrisiken bei der Verwendung von KI-generiertem Code gehören die folgenden.

Der Code basiert auf öffentlich zugänglichem Training

Das größte Sicherheitsrisiko von KI-generiertem Code besteht darin, dass Programmierassistenten auf öffentlich zugänglichen Codebasen trainiert wurden, von denen viele anfälligen Code enthalten. Ohne jegliche Schutzmechanismen reproduzieren sie anfälligen Code in neuen Anwendungen. In einer kürzlich erschienenen wissenschaftlichen Arbeit wurde festgestellt, dass mindestens 48 Prozent der KI-generierten Code-Vorschläge Sicherheitslücken enthielten.

Code wird ohne Berücksichtigung der Sicherheit erstellt

KI-gestützte Programmier-Tools verstehen den Sicherheitsansatz nicht und reproduzieren Code, der aufgrund der Häufigkeit in den Trainingsdaten korrekt erscheint. Dies ist vergleichbar mit dem Kopieren von Code aus Entwicklerforen in der Erwartung, dass er sicher ist.

Code könnte veraltete oder anfällige Abhängigkeiten verwenden

Eine damit zusammenhängende Sorge ist, dass Programmierassistenten bei ihren Versuchen, Programmieraufgaben zu lösen, anfällige oder veraltete Abhängigkeiten in neue Projekte einbringen könnten. Unkontrolliert kann dies zu erheblichen Schwachstellen in der Lieferkette führen.

Der Code gilt als geprüft und sicher

Ein weiteres Risiko besteht darin, dass Entwickler zu viel Vertrauen in KI-generierten Code haben. Viele Entwickler gehen fälschlicherweise davon aus, dass KI-Codevorschläge geprüft und sicher sind. Eine Snyk-Umfrage ergab, dass fast 80 Prozent der Entwickler und Anwender der Meinung sind, KI-generierter Code sei sicherer - ein gefährlicher Trend.

Es gilt zu bedenken Sie, dass KI-generierter Code nur so gut ist wie seine Trainingsdaten und Prompts. LLMs haben eine Wissensgrenze und sind sich neuer und aufkommender Schwachstellenmuster nicht bewusst. Wenn ein Prompt eine Sicherheitsanforderung nicht spezifiziert, fehlen dem generierten Code möglicherweise grundlegende Sicherheitskontrollen oder Schutzmaßnahmen.

Der Code könnte illegal das geistige Eigentum oder die Codebasis eines anderen Unternehmens nutzen

Programmierassistenten werfen erhebliche Probleme in Bezug auf geistiges Eigentum (IP) und Datenschutz auf. Codeassistenten können große Teile lizenzierten Open-Source-Codes wortwörtlich generieren, was zu einer Verunreinigung des geistigen Eigentums in der neuen Codebasis führt. Einige Tools schützen vor der Wiederverwendung großer Teile von Public-Domain-Code, aber KI kann ohne einen solchen Schutz urheberrechtlich geschützten Code oder proprietäre Algorithmen vorschlagen. Um sinnvolle Vorschläge zu erhalten, könnten Entwickler diese Tools mit urheberrechtlich geschütztem Code oder vertraulicher Logik versorgen. Diese Eingaben könnten gespeichert oder später beim Modelltraining verwendet werden, wodurch möglicherweise Geheimnisse preisgegeben werden.