Nvidia a doublé la domination de l’intelligence artificielle et dévoile une nouvelle gamme de GPU IA conçus pour repousser les limites de la puissance de calcul. La feuille de route annoncée à la NVIDIA GPU Technology Conference (GTC) 2025 présente le Blackwell Ultra GB300 (expédié plus tard cette année), suivi de Vera Rubin (2026) et Rubin Ultra (2027).
Les bénéfices ont atteint 2 300 $ par seconde, l’activité du centre de données de Nvidia dépasse le segment du GPU de jeu, indiquant un changement de tremblement de terre dans les priorités de l’entreprise.
« L’industrie a besoin de 100 fois plus de temps que nous avions besoin de l’année dernière », a déclaré Jensen Huang, fondateur et PDG de NVIDIA, mettant en évidence la demande insatiable de puissance informatique de l’IA.
Blackwell Ultra: puissant actualisation du cycle en milieu
Le Blackwell Ultra GB300, prévu à la fin de 2025, ne sera pas un design complètement nouveau, mais servira plutôt de mise à niveau de l’architecture Blackwell originale.
• Performance de l’IA: 20 Petaflops d’inférence FP4 (Identique à Blackwell).
• Expansion de la mémoire: 288 Go de mémoire HBM3E (augmentée par rapport à 192 Go).
• Cluster d’entreprise: le DGX GB300 « SuperPod » dispose de l’informatique 11,5 FP4 et 300 To de mémoire (jusqu’à 240 To dans Blackwell).
Vera Rubin & Rubin Ultra: l’avenir du traitement de l’IA
La prochaine architecture GPU majeure de Nvidia, Vera Rubin, devrait arriver en 2027 dans la seconde moitié de 2026.
• Vera Rubin: 50 Petaflops avec des performances FP4 – 2,5 fois plus vite que Blackwell Ultra.
Rubin Ultra: Le GPU Dual Rubin fusionne en un et propose 100 pétaflops de FP4 et un incroyable 1 To de mémoire HBM.
• Système de rack NVL576: 15 Xflops d’inférence FP4 et 5 Xflops de formation FP8 – 14x Blackwell Ultra Performance.
Ces mises à niveau pourraient réduire considérablement le temps de traitement de l’IA, NVIDIA affirmant que le cluster NVL72 exécute Deepseek -R1 671B, générant des réponses en 10 secondes, 10 fois plus rapidement que le GPU H100 2022.
Nouveau matériel: Station DGX et NVL72 Rack
Pour les entreprises à la recherche d’un traitement d’IA à unité unique, NVIDIA a introduit des stations DGX.
• GB300 Blackwell Ultra GPU.
• 784 Go de mémoire système unifiée.
• 800 Gb
• 20 Petaflops de performance d’IA.
Le rack NVL72 sera une centrale à rack unique qui propose 1,1 exaflops pour l’informatique FP4, 20 To de mémoire HBM et des vitesses de mise en réseau de 14,4 To / sec.
Le contrôle de l’IA de Nvidia et le chemin à venir
La dernière annonce de Nvidia intervient au milieu des rapports selon lesquels la société a déjà expédié 11 milliards de dollars de GPU Blackwell en 2025, les meilleurs acheteurs ayant acheté 1,8 million d’unités jusqu’à présent.
Huang a regardé plus loin et a confirmé que l’architecture GPU 2028 de Nvidia sera nommée « Feynman ».