Es ist Mittwoch, die Woche ist in vollem Gang und die KI-Industrie legt nach. Heute mit einem dichten Paket: Anthropic baut den Kreislauf zwischen Code-Generierung und Code-Prüfung weiter aus, Google dominiert beim Spreadsheet-Benchmark, und Mozilla profitiert von KI-unterstützter Sicherheitsforschung. Dazu bringt OpenAI visuelle Lernhilfen in ChatGPT.
Im folgenden haben wir vier relevante Entwicklungen zusammengefasst.
Anthropic launcht Code Review in Claude Code
Das "Vibe Coding"-Phänomen hat ein bekanntes Folgeproblem: KI-Tools generieren Code schneller, als menschliche Reviewer ihn prüfen können. Pull Requests stauen sich. Anthropic hat darauf mit dem neuen Feature Code Review in Claude Code reagiert, das seit Montag für Teams- und Enterprise-Kunden in der Research Preview verfügbar ist.
Laut Anthropics Head of Product Cat Wu ist das direkte Reaktion auf Feedback von Enterprise-Kunden: Claude Code produziere massenhaft Pull Requests, aber die Review-Kapazität halte nicht Schritt. Code Review soll genau diesen Engpass auflösen, ein KI-System überprüft also den Output eines anderen KI-Systems.
Das ist kein Paradox, sondern ein logischer nächster Schritt: Automatisierung braucht Qualitätssicherung, und die lässt sich ebenfalls automatisieren. Ob das in der Praxis Vertrauen schafft oder nur die Fehlerquellen verschiebt, wird sich zeigen. Den Einstieg ins Thema KI im Software Engineering haben wir bereits beleuchtet, Code Review ist die konsequente Fortsetzung davon.
Quelle: TechCrunch
Gemini erreicht SOTA in Google Sheets
Google hat neue Beta-Funktionen für Gemini in Google Sheets angekündigt und dabei einen Benchmark-Erfolg kommuniziert: Laut eigenen Angaben erreicht Gemini in Sheets auf dem öffentlichen SpreadsheetBench-Datensatz eine Erfolgsrate von 70,48 %, und übertrifft damit nach eigenen Aussagen die Konkurrenz sowie menschliche Experten-Benchmarks.
SpreadsheetBench bewertet die Fähigkeit von Modellen, reale, komplexe Tabellenkalkulationen autonom zu bearbeiten. 70 % ist ein solider Wert, aber "nears human expert ability" sollte man als Marketing-Formulierung einordnen, nicht als Beweis vollständiger Gleichwertigkeit.
Praktisch bedeutet das: Nutzerinnen und Nutzer von Google Workspace können Sheets zunehmend per natürlicher Sprache steuern, von einfachen Formatierungen bis hin zu komplexen Datenanalysen. Für KMU und Data-Professionals, die viel mit Tabellenkalkulationen arbeiten, ist das ein relevantes Update. Die neuen Features sind als Beta verfügbar.
Quelle: Google AI Blog
Anthropic und Mozilla: Claude findet 22 Firefox-Lücken in zwei Wochen
In einer Kooperation mit Mozilla hat Claude Opus 4.6 innerhalb von zwei Wochen 22 Sicherheitslücken im Firefox-Browser identifiziert. Mozilla stufte davon 14 als hochkritisch ein, das entspricht laut Anthropic fast einem Fünftel aller hochkritischen Firefox-Schwachstellen, die im gesamten Jahr 2025 behoben wurden.
Die Fixes sind bereits in Firefox 148.0 ausgeliefert und schützen damit Hunderte Millionen Nutzerinnen und Nutzer. Anthropic dokumentiert zudem, dass Claude in gut getesteter Open-Source-Software bereits über 500 Zero-Day-Schwachstellen identifiziert haben soll, auch diese Zahl stammt aus eigenen Angaben.
Was das bedeutet: KI-gestützte Sicherheitsforschung erreicht eine Geschwindigkeit und Skalierung, die mit rein menschlichen Teams schwer erreichbar ist. Das ist ein echter Fortschritt für die Open-Source-Community, sofern die gefundenen Lücken verantwortungsvoll disclosed und nicht missbraucht werden.
Quelle: Anthropic Blog
ChatGPT: Visuelle Lernhilfen für Mathe und Naturwissenschaften
OpenAI hat neue interaktive Lernfunktionen in ChatGPT eingeführt: Für mehr als 70 Mathe- und Naturwissenschafts-Konzepte soll ChatGPT ab sofort dynamische, visuelle Erklärungen liefern, Formeln und Beziehungen werden in Echtzeit dargestellt und erklärbar gemacht.
Laut OpenAI nutzen wöchentlich 140 Millionen Menschen ChatGPT, um Mathe- und Wissenschaftsthemen zu verstehen. Eine Gallup-Umfrage zeige zudem, dass mehr als die Hälfte der US-Erwachsenen Schwierigkeiten mit Mathematik habe. Die neuen Features sind nach eigenen Angaben global und für alle Abomodelle verfügbar.
Visuell-interaktives Lernen ist pädagogisch gut belegt, das Update ist kein Quantensprung, aber ein sinnvolles Qualitäts-Upgrade, das ChatGPT als Lernwerkzeug weiter festigt. Für Eltern, Studierende und Selbstlernende dürfte das Feature direkten Alltagsnutzen haben.
Quelle: OpenAI Blog
Meine Meinung
Anthropic dominiert heute gleich zweifach: Code Review schliesst den KI-Entwicklungskreislauf, die Mozilla-Kooperation zeigt, dass Claude als Sicherheitstool ernstzunehmen ist. Beides sind keine Demo-Features, sondern produktive Anwendungen mit messbarem Nutzen. Google und OpenAI liefern solide Incremental-Updates, Gemini in Sheets und ChatGPT-Lernfunktionen sind relevant, aber kein Paradigmenwechsel. Der Mittwoch gehört Anthropic.
Signal der Woche. Eine Nachricht. Eine Analyse. Jeden Freitag im Newsletter. 👉 aisyndicate.ch/#/portal