Der Start in die neue Woche bringt drei Meldungen, die unterschiedliche Seiten der KI-Industrie beleuchten: einen neuen Modell-Release, eine ungewöhnlich tiefe Fehleranalyse und eine Datenschutz-Entscheidung mit Auswirkungen auf Millionen Nutzer.
xAI veröffentlicht Grok 4.3 mit eigenständigen Agentenfähigkeiten
xAI hat am Wochenende Grok 4.3 veröffentlicht, das sich explizit an Entwickler und Unternehmen richtet. Das Modell verarbeitet laut xAI bis zu 100 Token pro Sekunde und ist auf Tool-Calling optimiert. Es bringt eigenständige Fähigkeiten mit: Websuche, X-Suche, Python-Code-Ausführung, Dateisuche per RAG sowie die Erstellung von Excel-, PDF- und PowerPoint-Dateien.
Parallel dazu startet der „Grok Imagine Agent Mode" in der Beta-Phase, ein agentisches Bildgenerierungssystem für zusammenhängende kreative Produktionen. In Benchmarks zeigt Grok 4.3 eine verbesserte Leistung bei realen Wissensarbeiten gegenüber dem Vorgänger, bleibt aber hinter den Top-Modellen von OpenAI und Anthropic. Die Positionierung ist damit klar: Grok 4.3 soll kein Benchmark-Sieger sein, sondern ein praktisches Werkzeug für Entwickler-Workflows.
ARC-Analyse: Drei systematische Denkfehler bei GPT-5.5 und Claude Opus 4.7
Die ARC Prize Foundation hat 160 Reasoning-Traces von GPT-5.5 und Claude Opus 4.7 im Benchmark ARC-AGI-3 ausgewertet, einem interaktiven, rundenbasierten Testsystem, bei dem Modelle erkunden, Hypothesen bilden und handeln müssen. Das Ergebnis: Beide Modelle erreichen weniger als ein Prozent Lösungsrate.
Was diese Analyse von üblichen Benchmark-Berichten unterscheidet, ist die Tiefe: Statt nur Pass/Fail zeigt die Auswertung drei systematische Fehlermuster, die erklären, warum aktuelle Top-Modelle an interaktiven Aufgaben scheitern. Dieses Format, Reasoning-Traces statt reine Metriken, gibt Forscherinnen und Forschern deutlich mehr Anhaltspunkte für gezielte Weiterentwicklungen. Wer die Debatte um aktuelle LLM-Benchmarks und ihre Grenzen verfolgt, findet hier einen ungewöhnlich konkreten Datenpunkt.
Die Ergebnisse rücken ARC-AGI-3 als Maßstab stärker in den Vordergrund: Klassische Benchmarks messen das Endresultat, ARC-AGI-3 prüft den Prozess, und genau dort zeigen sich die Lücken.
OpenAI aktiviert Marketing-Cookies für Gratis-Nutzer standardmäßig
OpenAI hat Ende April per E-Mail mitgeteilt, dass bei kostenlosen ChatGPT-Konten Marketing-Cookies ab sofort standardmäßig aktiv sind. Das Unternehmen teilt dabei begrenzte Daten, Cookie-IDs und E-Mail-Adressen, mit Werbepartnern, um Werbung auf Drittplattformen wie Instagram auszuspielen. Laut OpenAI-Sprecherin Taya Christianson werden Chat-Inhalte nicht weitergegeben.
WIRED bestätigte, dass die Einstellung bei zwei getesteten Gratis-Konten automatisch aktiviert war, bei zahlenden Nutzern nicht. Der Opt-out ist über die ChatGPT-App unter Settings > Data Controls > Marketing Privacy möglich, in Deutschland ist diese Einstellung bisher noch nicht verfügbar, was angesichts der DSGVO-Anforderungen an Einwilligungspflichten problematisch erscheint. Auf der Website kann der Cookie-Manager genutzt werden.
Der Schritt passt in eine Tendenz: OpenAI schaltet seit Februar in einigen Ländern Werbung in ChatGPT. Da laut OpenAI-Angaben mehr als 90 Prozent der Nutzer die kostenlose Version verwenden, betrifft das eine erhebliche Nutzerbasis. Für eine vertiefte Einordnung der Datenschutzentwicklungen bei ChatGPT im europäischen Kontext lohnt sich ein Blick auf die DSGVO-Problematik rund um ChatGPT.
- → The Decoder – xAI veröffentlicht Grok 4.3 und neuen Imagine Multimedia-Agenten
- → The Decoder – Selbst die neuesten KI-Modelle machen drei systematische Denkfehler
- → The Decoder – ChatGPT trackt Gratis-Nutzer jetzt standardmäßig für Werbezwecke
- → WIRED – OpenAI Enables Cookies by Default for Free ChatGPT Users