Die Konferenzsaison ist in vollem Gang, und NVIDIA hat gestern in San Jose die Messlatte für alle anderen gesetzt. Dazu bringt OpenAI zwei neue Modelle, die speziell auf Agenten-Workloads zugeschnitten sind. Ein dichter Mittwoch.
Was heute Morgen zählt: NVIDIA legt auf der GTC 2026 eine vollständige Plattform-Roadmap bis 2027+ vor: Von der Vera-Rubin-Architektur über KI im Orbit bis zur nächsten GPU-Generation Feynman. OpenAI ergänzt das Bild mit GPT-5.4 mini und nano, die Entwickler gezielt für schnelle Agenten-Pipelines positionieren.
NVIDIA GTC 2026: Vera Rubin, Feynman und eine neue Ära der KI-Infrastruktur
Jensen Huang eröffnete seine GTC-Keynote im ausverkauften SAP Center in San Jose mit einem klaren Framing: Der Token ist die Grundeinheit moderner KI und NVIDIA will die Infrastruktur liefern, die jede Schicht dieser Wertschöpfungskette abdeckt.
Kernstück der Ankündigungen ist die NVIDIA Vera Rubin Platform: sieben Chips, fünf Rack-Scale-Systeme und ein integrierter Supercomputer für Agentic AI. Dazu kommen die neue Vera CPU und die BlueField-4 STX Storage-Architektur. Das System soll, laut Unternehmensangaben, vollständig vertikal integriert und als "ein einziges, durchoptimiertes System" konzipiert sein, vom Silicon bis zur Software.
Ausblick auf die Folge-Generation: Feynman. Die Architektur umfasst die neue Rosa CPU (benannt nach Rosalind Franklin) sowie den LP40 LPU, BlueField-5 und CX10, vernetzt über NVIDIAs Kyber-Interconnect. Roadmap: 2027 und darüber hinaus.
Jensen Huang prognostizierte in seiner Keynote zudem einen kumulierten Gesamtumsatz von mindestens 1 Billion US-Dollar zwischen 2025 und 2027, was naturlich eine CEO-Aussage ist, die entsprechend eingeordnet werden sollte. Die Nachfrage nach GPU-Computing sei, nach eigenen Angaben, "um den Faktor 1 Million gestiegen."
Quelle: NVIDIA GTC 2026: Live Updates on What's Next in AI
NVIDIA Space-1: KI-Rechenzentren verlassen die Erde
Eine der unerwarteten Ankündigungen der GTC: NVIDIA bringt seine KI-Infrastruktur in den Orbit. Huang stellte Space-1 Vera Rubin vor, eine Weiterentwicklung der Vera-Rubin-Architektur, die explizit für den Einsatz in Erdumlaufbahnen konzipiert wird. Ziel sind vollwertige AI Factories im Weltraum.
Die Logik dahinter ist nachvollziehbar: Satellitengestützte KI-Verarbeitung könnte Latenz für erdgebundene Anwendungen reduzieren, Edge-Computing in abgelegenen Regionen ermöglichen und bestimmte Sicherheits- oder Souveränitätsanforderungen bedienen. Konkrete Deployment-Zeitpläne oder Partnerangaben zur Trägerrakete hat NVIDIA bislang nicht kommuniziert.
Dass der Architekturname auf Vera Rubin verweist, die Astronomin, deren Arbeit die dunkle Materie nachwies, ist kein Zufall: NVIDIA zieht eine explizite Linie zwischen wissenschaftlicher Grundlagenforschung und industrieller Infrastruktur. Ob KI-Rechenzentren im Orbit in drei oder in zehn Jahren Realität werden, bleibt offen. Der Signal-Wert der Ankündigung liegt eher in der strategischen Positionierung als im kurzfristigen Produktversprechen.
Quelle: NVIDIA GTC 2026: Live Updates on What's Next in AI
OpenAI GPT-5.4 mini und nano: Schlanke Modelle für Agenten-Stacks
OpenAI hat gestern GPT-5.4 mini und GPT-5.4 nano veröffentlicht, die bisher leistungsfähigsten kleinen Modelle des Unternehmens, laut Unternehmensangaben. GPT-5.4 mini soll gegenüber dem Vorgänger GPT-5 mini in Coding, Reasoning, Multimodal und Tool-Use deutlich besser abschneiden und dabei mehr als doppelt so schnell laufen.
Auf dem SWE-Bench Pro (Selbstangabe OpenAI) erzielt mini 54,4 %, nano 52,4 %, zum Vergleich: GPT-5 mini lag bei 45,7 %. GPT-5.4 nano ist das kleinste und günstigste Modell der Serie, gedacht für Klassifikation, Datenextraktion, Ranking und einfache Subagenten in grösseren Pipelines.
In der API kostet GPT-5.4 mini 0,75 USD pro Million Input-Token und 4,50 USD pro Million Output-Token, bei einem Kontextfenster von 400k Token. Die Modelle sind ab sofort im API, in Codex und in ChatGPT verfügbar.
Quelle: Introducing GPT-5.4 mini and nano
NVIDIA zieht auf der GTC 2026 die komplette Roadmap auf, von Vera Rubin über Feynman bis zum Orbit. Das ist beeindruckendes Plattform-Marketing, aber europäische Unternehmen sollten genau hinschauen, wie stark sie sich in diese vertikal integrierte Infrastruktur einkaufen wollen. GPT-5.4 mini und nano sind derweil das, was Entwickler wirklich brauchen: schnelle, günstige Modelle für Agenten-Pipelines, die im Alltag funktionieren, ohne die grossen Modelle für jeden Schritt zu bemühen. Beide Entwicklungen zusammen beschleunigen den Trend hin zu mehrschichtigen Agenten-Architekturen, die Europa regulatorisch noch kaum erfasst hat.
- → NVIDIA Blog: GTC 2026 Live Updates, alle Keynote-Ankündigungen im Überblick
- → NVIDIA Pressemitteilung: Vera Rubin Platform, 7 Chips, 5 Rack-Scale-Systeme, 1 Supercomputer
- → NVIDIA Pressemitteilung: Space Computing, AI Factories im Orbit mit Space-1 Vera Rubin
- → OpenAI: Introducing GPT-5.4 mini and nano, Benchmarks, Preise und Verfügbarkeit
Signal der Woche. Eine Nachricht. Eine Analyse. Jeden Freitag im Newsletter. 👉 aisyndicate.ch/#/portal