Was ist passiert
Nvidia hat auf der GTC 2026 im ausverkauften SAP Center die Vera-Rubin-Plattform offiziell scharfgestellt. Jensen Huang präsentierte nicht nur einen Chip, sondern einen Verbund aus sieben Bausteinen, fünf Rack-Typen und kompletten POD-Konfigurationen mit bis zu 1.152 Rubin-GPUs. Herzstück ist das NVL72-Rack: 72 Rubin-GPUs, 36 Vera-CPUs, ConnectX-9-SuperNICs und BlueField-4-DPUs auf 18 Compute-Trays – laut Nvidia 1,3 Millionen Einzelteile und 1.300 Chips in einem 1,8-Tonnen-Rack. Gegenüber der frisch ausgelieferten Blackwell-Generation verspricht Nvidia die vierfache Trainingsleistung und zehnfache Inferenzleistung pro Watt; NVLink 6 liefert 3,6 TB/s pro GPU, 260 TB/s pro Rack. Der Vera-Rubin-POD mit 40 Racks und 60 Exaflops soll ab der zweiten Jahreshälfte 2026 bei AWS, Google Cloud, Microsoft Azure und Oracle landen. Zusätzlich integrierte Nvidia erstmals Fremd-Silizium: Groq-3-LPX-Inferenzkarten docken als Spezialbeschleuniger im eigenen Ökosystem an. Die Roadmap spannt weiter bis 2028 (Vera Rubin Ultra, danach Feynman) und soll laut Huang eine kumulative Nachfrage von über einer Billion Dollar adressieren – eine interne Prognose, keine unabhängige Marktzahl.