Sur scène lors de la conférence du GTC 2025 de NVIDIA à San Jose mardi, le PDG Jensen Huang a annoncé une multitude de nouveaux GPU descendant le pipeline de produits de la société au cours des prochains mois.
Le plus important est peut-être Vera Rubin. Vera Rubin, qui devrait être publiée dans la seconde moitié de 2026, comportera des dizaines de gigaoctets de mémoire et un CPU conçu par Nvidia personnalisé appelé Vera. Vera Rubin offre des éléments de performance substantiels par rapport à son prédécesseur, Grace Blackwell, prétend Nvidia, en particulier sur les tâches d’inférence et de formation.
Lorsqu’il est associé à Vera, Rubin – qui est deux GPU dans un, techniquement – peut gérer jusqu’à 50 Petaflops tout en faisant l’inférence (c’est-à-dire en exécutant des modèles AI), plus du double des 20 Petaflops pour les puces Blackwell actuelles de Nvidia. De plus, Vera est environ deux fois plus rapide que le CPU utilisé dans le GPU Grace Blackwell de Nvidia.
Rubin sera suivi par Rubin Ultra dans la seconde moitié de 2027, une collection de quatre GPU dans un seul paquet offrant jusqu’à 100 pétaflops de performance.
À l’horizon proche – H2 2025 – Nvidia publiera Blackwell Ultra, un GPU qui sera disponible dans plusieurs configurations. Une seule puce ultra offrira les mêmes 20 Petaflops de performance AI que Blackwell, mais avec 2888 Go de mémoire – jusqu’à 192 Go à Vanilla Blackwell.
À l’horizon lointain, les GPU Feynman. Huang pendant le Keynote a donné peu de détails sur l’architecture de Feynman, du nom du physicien théorique américain Richard Feynman – Save qu’il présente un processeur Vera. Nvidia prévoit d’amener Feynman, qui succédera à Rubin Vera, sur le marché en 2028.
Mis à jour 3/18 15:07 PM Pacific: Une version antérieure de cette histoire a indiqué que Vera Rubin avait des «dizaines de térabbytes» de mémoire. En fait, il a des «dizaines de gigaoctets» de mémoire. Nous regrettons l’erreur.