Immer ausgefeiltere KI-, Audio- und Videotechnologien sowie eine Fülle persönlicher Daten von Nutzern, die in sozialen Medien verfügbar sind, haben Phishing mit Deepfakes zu einem neuen Angriffsvektor gemacht, der Security-Verantwortlichen und CISOs Sorgen bereiten sollte.

Die Deepfake-Technologie nutzt künstliche Intelligenz (KI), um irreführende Audio-, Video- und Bilddateien zu erzeugen. Bislang dienten Deepfakes hauptsächlich der Unterhaltung und politischen Zwecken, sowohl harmlos als auch bösartig. Experten warnen jedoch, dass die Deepfake-Technologie auch eine Reihe von IT-Risiken für Unternehmen birgt. Beim Phishing mit Deepfakes beispielsweise werden Benutzer mit Hilfe von Deepfake-Inhalten dazu verleitet, unberechtigte Zahlungen zu leisten oder sensible Informationen preiszugeben, die Cyberkriminelle zu ihrem Vorteil nutzen können.

In einem viel beachteten Beispiel aus dem Jahr 2019 nutzten Cyberkriminelle Deepfake Phishing, um den CEO eines britischen Energieunternehmens dazu zu bringen, ihnen 243.000 US-Dollar zu überweisen, wie das Wall Street Journal berichtet. Mithilfe einer KI-basierten Stimmfälschungssoftware gaben sich die Kriminellen erfolgreich als Leiter der Muttergesellschaft des Unternehmens aus und ließen den CEO glauben, er spreche mit seinem Vorgesetzten.

Mit der weiteren Entwicklung der Technologie werden solche Deepfake-Phishing-Kampagnen mit Sicherheit häufiger und effektiver werden. IT-Teams können Unternehmensanwender darauf vorbereiten, diese Angriffe abzuwehren, indem sie ihnen erklären, was Deepfake Phishing ist und wie es funktioniert.

Die verschiedenen Arten von Phishing-Angriffen per Deepfakes

Deepfake-Phishing-Angriffe lassen sich in die folgenden Kategorien einteilen:

Angriffe in Echtzeit. Bei einem erfolgreichen Echtzeitangriff sind die präparierten Audio- oder Videodaten so ausgeklügelt, dass sie dem Opfer vorgaukeln, dass die Person am anderen Ende des Anrufs diejenige ist, die sie vorgibt zu sein, zum Beispiel ein Kollege, Geschäftspartner oder ein Kunde. Bei diesen Interaktionen erzeugen die Angreifer wahrscheinlich ein starkes Gefühl der Dringlichkeit, indem sie den Opfern imaginäre Fristen, Strafen und andere Konsequenzen für Verzögerungen vorgaukeln, um sie in Panik zu versetzen und zu einer Reaktion zu bewegen.

Nicht-Echtzeit-Angriffe. Bei Nicht-Echtzeit-Angriffen gibt sich ein Cyberkrimineller über gefälschte Audio- oder Videonachrichten als eine Person aus, die er dann über asynchrone Kommunikationskanäle wie Chat, E-Mail, Sprachnachricht oder soziale Medien verbreitet. Diese Art der Kommunikation verringert den Druck auf Kriminelle, in Echtzeit glaubwürdig zu reagieren, und ermöglicht es ihnen, einen Deepfake-Clip zu perfektionieren, bevor sie ihn verbreiten. Infolgedessen kann ein Angriff, der nicht in Echtzeit erfolgt, ziemlich ausgefeilt sein und erregt bei den Benutzern weniger Verdacht. Wenn ein Deepfake-Video oder -Audio-Clip per E-Mail verbreitet wird, ist es auch wahrscheinlicher, dass er an den Sicherheitsfiltern vorbeikommt als herkömmliche, textbasierte Phishing-Kampagnen.

Abbildung 1: Der Deepfake wird solange von Algorithmen in Schleifen optimiert, bis es nicht mehr als Fälschung erkannt wird.

Angriffe, die nicht in Echtzeit erfolgen, ermöglichen es den Angreifern außerdem, bei den Zielen weitflächiger vorzugehen. Jemand, der sich als Finanzvorstand ausgibt, könnte beispielsweise dasselbe Audio- oder Videomemo an alle Mitglieder der Finanzabteilung senden, um möglichst vielen Personen sensible Informationen zu entlocken.



Bei beiden Arten von Angriffen liefern die Spuren und Daten in den sozialen Medien in der Regel genügend Informationen für Angreifer, um strategisch dann zuzuschlagen, wenn die Ziele am empfänglichsten sind.