Der Donnerstag brachte eine ungewöhnliche Dichte an Frontier-Ankündigungen: OpenAI hat auf allen Fronten gleichzeitig gefeuert – Codex, Life Sciences, Cybersicherheit – während Anthropic mit einem verbesserten Flagship-Modell nachzog. Ein Überblick.
OpenAI Codex: Computer Use, Bildgenerierung, Memory – der Agent kommt ins Büro
Codex war bisher ein starkes Coding-Tool. Die gestern veröffentlichte Aktualisierung macht daraus etwas Grundlegenderes: einen Agenten, der den Computer übernehmen kann. Mit Background Computer Use sieht Codex den Bildschirm, klickt, tippt – und das im Hintergrund, ohne die eigene Arbeit zu unterbrechen. Mehrere Instanzen laufen parallel auf demselben Mac, ohne sich gegenseitig zu stören.
Neu ist auch ein integrierter In-App-Browser, in dem Nutzer direkt auf Seiten kommentieren können, um dem Agenten präzise Anweisungen zu geben. Für Frontend-Entwicklung, App-Tests und Spieleentwicklung ist das ein erheblicher Fortschritt. Dazu kommt die Bildgenerierung via gpt-image-1.5 direkt im Workflow sowie Memory: Codex lernt aus früheren Aktionen und merkt sich Präferenzen. Über 90 neue Plugins verbinden den Agenten mit alltäglichen Tools und Apps.
Für Entwickler wird das Relevanzschwelle deutlich gesenkt – komplexe Multi-Schritt-Aufgaben, die früher Orchestrierung erforderten, laufen jetzt durch einen einzigen Agenten.
Anthropic: Claude Opus 4.7 – stärker im Code, schärfer im Blick
Anthropic hat Claude Opus 4.7 allgemein verfügbar gemacht. Das Modell liefert spürbare Verbesserungen gegenüber Opus 4.6 bei anspruchsvollen Software-Engineering-Aufgaben: Nutzer berichten, dass sie auch schwierige Coding-Aufgaben, die bisher enge Aufsicht brauchten, nun eigenständig delegieren können. Hinzu kommt eine deutlich verbesserte Bildverarbeitung mit höherer Auflösung.
Bemerkenswert ist der Sicherheitsaspekt: Opus 4.7 ist das erste Modell, bei dem Anthropic gezielt Cyber-Fähigkeiten reduziert und automatische Erkennungs- und Blockmechanismen für risikoreiche Anfragen eingebaut hat. Was dabei gelernt wird, soll den Weg für eine breitere Veröffentlichung des deutlich mächtigeren Claude Mythos Preview ebnen.
OpenAI betritt die Arzneimittelforschung: GPT-Rosalind
Mit GPT-Rosalind stellt OpenAI ein spezialisiertes Frontier-Reasoning-Modell für Biologie, Drug Discovery und translationale Medizin vor. Das Modell ist auf wissenschaftliche Workflows optimiert – Literaturauswertung, Hypothesengenerierung, experimentelles Planning – und versteht Chemie, Protein-Engineering und Genomik auf einem neuen Niveau. Als Research Preview ist es zunächst in einem geschlossenen Rahmen verfügbar.
Der Hintergrund: Die durchschnittliche Zeitspanne von der Zielentdeckung bis zur Zulassung eines Medikaments beträgt 10 bis 15 Jahre. GPT-Rosalind soll genau dort ansetzen, wo die grössten Zeitverluste entstehen – in der frühen Discovery-Phase.
KI für Cyberabwehr: OpenAI setzt 10 Mio. Dollar ein
OpenAI hat gestern auch seinen "Trusted Access for Cyber"-Ansatz konkretisiert: Organisationen wie Socket, Semgrep, Calif und Trail of Bits erhalten als erste Zugang zu Frontier-Modellen für Cybersicherheitsanwendungen. Mit 10 Millionen Dollar in API-Credits fördert OpenAI zudem weitere Teams, die sich auf Schwachstellenforschung und Open-Source-Sicherheit spezialisieren. Das Programm adressiert eine strukturelle Schwäche: Viele Entwicklerteams haben keine rund-um-die-Uhr-Sicherheitskapazität – Frontier-KI soll diese Lücke schliessen.