Cyber-Angriffe: Orchestriert oder automatisiert KI?Menschliches Eingreifen erforderlich
24. November 2025
Mitte September entdeckten die Sicherheitsverantwortlichen von Anthropic einen Vorfall, der sich nach eingehender Untersuchung als ein Cyber-Angriff herausstellte. Mit dem KI-Tool „Claude Code“ hatten die Angreifer ihre Attacken auf verschiedene Ziele orchestriert und teilwiese sogar automatisiert. Attackiert wurden Technologieunternehmen, Finanzinstitute, Chemieunternehmen und Behörden.
Als Teil der Aufklärung veröffentlichte das KI-Unternehmen einen Report indem es genauer darauf einging, wie die bösartigen Akteure vorgingen. Sie nutzten sowohl die Techniken des Jailbreakings, als auch des Social Engineerings, um die eingebauten Schutzvorkehrungen des KI-Tools zu umgehen.
Dafür zerlegten sie ihre Angriffsoperationen in kleine, scheinbar harmlose Aufgaben, die das Tool ausführen sollte. Die Social Engineering-Komponente bestand darin, dass sie dem Tool vorspielten, sie wären ein Mitarbeiter einer legitimen Cyber-Sicherheitsfirma und die Antworten auf ihre Fragen würden für defensive Tests verwendet werden. Im weiteren Verlauf der gestarteten Angriffe soll das gejailbreakte Tool dann 80 Prozent der Tätigkeiten übernommen haben.
Soweit nun der Vorfall, dessen Report natürlich für viel Aufsehen gesorgt, aber auch viel Widerspruch aus der Security-Community erhalten hat. Zunächst aber sollten wir festhalten, dass bereits seit einigen Jahren über die Ausnutzung von öffentlich zugänglichen KI-Tools innerhalb der Community diskutiert wird.
Gleichzeitig wirft der kritische Blick auf die Dokumentation bei Anthropic jedoch auch die Frage auf, inwieweit nun wirklich von einer ersten KI-gesteuerten Cyber-Attacke gesprochen werden kann. Kritiker werfen den Forschern vor, den Vorfall zu überzeichnen, dass wesentliche Informationen wie IOCs fehlen oder aber wohl deutlich mehr menschliche Aktivität und Kontrolle stattgefunden haben muss.
Ganz generell aber lässt sich für die Security-Community festhalten, dass mehr und mehr Attacken mit der Unterstützung von KI-Tools zumindest zum Teil automatisiert werden können. Erkenntnisse wie die der Sicherheitsforscher lassen außerdem darauf schließen, dass diese Angriffe über reines Phishing hinausgehen. KI-Agenten lassen sich für Teilaufgaben wie der Zusammenstellung von öffentlich zugänglichen Informationen, Reconnaissance, der Analyse von Schwachstellen oder aber einer Bewertung von technischen Sicherheitsmaßnahmen nutzen.
All dies erfordert sicherlich noch die Human Intervention, also das menschliche Eingreifen wie korrigieren, nachrecherchieren. Eine komplette Automation eines Cyber-Angriffs, die selbständig und auch noch erfolgreich von einem kompromittierten oder aber dafür programmierten KI-Agenten durchgeführt wird, ist nach Einschätzung vieler Experten noch immer Zukunftsmusik.
Dr. Martin Krämer ist CISO-Advisor bei KnowBe4.