Die KI-Sicherheitslage hat sich gestern Nacht verändert. Nicht durch eine Ankündigung, sondern durch einen Testergebnis: Anthropics Mythos Preview kann eigenständig mehrstufige Hackerangriffe auf Unternehmensnetzwerke durchführen, Aufgaben, die menschliche Experten Tage kosten. Gleichzeitig bringt OpenAI eine Cyber-Variante seines neuesten Modells raus, die explizit für Verteidiger freigeschaltet ist. Das Rennen zwischen Angreifer-KI und Defender-KI ist offiziell eröffnet.
Claude Mythos kann Netzwerke autonom hacken, und tut es mit 73% Erfolg auf Expertenebene
Das britische AI Security Institute (AISI) hat Anthropics Mythos Preview einem umfassenden Cyber-Capability-Test unterzogen, und die Ergebnisse sind ernüchternd. Das Modell erreichte bei sogenannten Capture-the-Flag-Challenges (CTF) auf Expertenebene eine Erfolgsrate von 73 Prozent. Auf Anfängerniveau liegt es bei 85–95 Prozent, und teilt sich die Spitzengruppe mit GPT-5.4, Codex 5.3 und Claude Opus 4.6.
Was das konkret bedeutet: Mythos Preview kann bei expliziter Anweisung und gewährtem Netzwerkzugang mehrstufige Angriffe auf verwundbare Systeme autonom ausführen, Schwachstellen selbst entdecken und ausnutzen. In kontrollierten Tests gelang dies ohne menschliche Begleitung, ein Fortschritt, den AISI als „deutlichen Sprung" gegenüber dem Stand von vor zwei Jahren bezeichnet. Damals scheiterten die besten verfügbaren Modelle noch an Anfängeraufgaben.
Das Modell wird deshalb nicht öffentlich freigegeben. Anthropic stuft es selbst als zu risikoreich ein.
Europa wacht auf, aber zu langsam
POLITICO sprach mit Beamten von acht europäischen Cybersicherheitsbehörden. Fazit: Nur das deutsche BSI hat überhaupt Gespräche mit Anthropic aufgenommen, ohne direkten Testzugang. Die EU-Cyberbehörde ENISA äußerte sich gar nicht. Das AI Office der EU-Kommission führt zwar Gespräche mit Anthropic im Rahmen des KI-Verhaltenskodex, bestätigte aber keinen Zugang zu Mythos.
Im Gegensatz dazu: Das Vereinigte Königreich hat das Modell bereits getestet und laut Minister Kanishka Narayan auf Basis der Erkenntnisse „Maßnahmen ergriffen". BSI-Chefin Claudia Plattner brachte es auf den Punkt, Werkzeuge von „außergewöhnlicher Macht" hätten „tiefgreifende Implikationen für die nationale und europäische Souveränität". Nur: Handlungsmacht hat sie bislang keine.
OpenAI öffnet GPT-5.4-Cyber für verifizierte Defender
Während Anthropic sein mächtigstes Modell unter Verschluss hält, geht OpenAI einen anderen Weg: Mit GPT-5.4-Cyber startet das Unternehmen eine Cyber-permissive Variante seines neuesten Modells, ausschließlich zugänglich für verifizierte Sicherheitsexperten und Teams, die kritische Infrastruktur schützen. Das Programm heisst „Trusted Access for Cyber" (TAC) und soll auf Tausende von Einzelpersonen und Hunderte von Teams skaliert werden.
OpenAI argumentiert, dass KI Angreifer und Defender gleichermassen verstärkt, und man deshalb gezielt die defensive Seite unterstützen müsse. Der Gedanke dahinter: Wer als erstes skaliert, bestimmt, auf welcher Seite die KI-Überlegenheit liegt.
Anthropic brieft Trump-Regierung, trotz laufender Klage
Kurioses Randgeschehen: Jack Clark, Mitgründer von Anthropic, bestätigte auf dem Semafor World Economy Summit, dass Anthropic die Trump-Administration persönlich über Mythos informiert hat. Das trotz einer laufenden Klage gegen das Pentagon, das Anthropic als „Supply-Chain-Risiko" eingestuft hatte, nachdem das Unternehmen die Anforderung abgelehnt hatte, dem Militär uneingeschränkten KI-Zugang für Massenüberwachung und autonome Waffen zu gewähren.
Clarks Botschaft: „Die Regierung muss über diese Dinge Bescheid wissen." Ob das diplomatisches Geschick ist oder ein strategisches Kalkül, offen.