
Il y avait de quoi se réjouir pour les observateurs de NVIDIA au CES cette semaine, avec l’annonce que le dernier GPU de la société, le Vera Rubin, est désormais en pleine production. Après tout, ce sont ces puissantes puces d’IA – les pioches et les pelles du boom de l’IA – qui ont contribué à faire de Nvidia l’entreprise la plus précieuse au monde.
Mais dans son discours d’ouverture, le PDG Jensen Huang a clairement indiqué que Nvidia ne se considère pas comme une simple entreprise de puces. La société est également un éditeur de logiciels, dont la portée couvre presque toutes les couches de la pile d’IA et qui mise gros sur l’IA physique, c’est-à-dire les systèmes d’IA qui fonctionnent dans le monde réel, tels que la robotique et les voitures autonomes.
Dans un communiqué de presse faisant la promotion de l’annonce de Nvidia au CES, une citation attribuée à Huang déclarait : « Le moment ChatGPT est arrivé pour la robotique. » Les percées dans l’IA physique, les modèles qui comprennent le monde réel, le raisonnent et planifient des actions, « permettent des applications entièrement nouvelles », a-t-il déclaré.
Mais dans le discours lui-même, Huang s’est montré plus prudent, affirmant que le moment ChatGPT pour l’IA physique était « juste au coin de la rue ». Cela peut paraître effrayant, mais la distinction est importante, surtout compte tenu de ce que Huang a déclaré au CES de l’année dernière lorsqu’il a présenté la plate-forme Cosmos World de Nvidia et a déclaré que le « moment ChatGPT » de la robotique était simplement « juste au coin de la rue ».
Alors, ce moment est-il vraiment arrivé, ou est-il toujours obstinément hors de portée ?
Huang lui-même semblait être conscient de cette lacune. « Le défi est clair », a-t-il déclaré hier dans son discours d’ouverture. « Le monde physique est diversifié et imprévisible. »
Nvidia excelle également en matière d’IA physique. Au cours de la dernière décennie, l’entreprise a jeté les bases en développant un écosystème de logiciels, de matériels et de systèmes de simulation d’IA pour les robots et les voitures autonomes. Mais il ne s’agissait pas de construire nos propres robots ou AV. Comme l’a déclaré le révérend Lebaredian, vice-président de la technologie de simulation chez Nvidia, au magazine Fortune l’année dernière, la stratégie reste la fourniture de pioches et de pelles.
Il ne fait aucun doute que Nvidia a fait des progrès à cet égard au cours de la dernière année. Dans le domaine de la conduite autonome, la société a annoncé aujourd’hui la famille Alpamayo de modèles d’IA ouverts, d’outils de simulation et d’ensembles de données visant à permettre aux véhicules autonomes de fonctionner en toute sécurité dans une gamme de scénarios de conduite rares et complexes, considérés comme certains des défis les plus difficiles à maîtriser en toute sécurité pour les systèmes de conduite autonome.
Nvidia a également publié de nouveaux modèles et données ouverts Cosmos et GR00T pour l’apprentissage et l’inférence des robots, faisant la promotion d’entreprises telles que Boston Dynamics, Caterpillar, Franka Robots, Humanoid, LG Electronics et NEURA Robotics. Ces sociétés lancent de nouveaux robots et machines autonomes basés sur la technologie Nvidia.
Malgré ses modèles, ses outils de simulation et ses plates-formes informatiques de plus en plus performants, Nvidia ne construit pas lui-même de voitures ou de robots autonomes. Les constructeurs automobiles doivent encore composer avec la surveillance réglementaire, les conditions de conduite réelles et l’acceptation du public pour transformer ces outils en systèmes capables de fonctionner en toute sécurité sur la voie publique. Les entreprises de robotique, quant à elles, doivent transformer l’IA en machines capables de manipuler le monde physique de manière fiable, à une échelle et à un coût commercialement significatifs.
La tâche d’intégration du matériel, des logiciels, des capteurs, des systèmes de sécurité et des contraintes du monde réel reste extrêmement difficile, longue et gourmande en capitaux. Et il est loin d’être certain que les progrès rapides de l’IA puissent à eux seuls surmonter ces obstacles. Il s’avère que le moment de ChatGPT ne concernait pas seulement le modèle sous le capot. Ils existent depuis plusieurs années. Il s’agissait d’expérience utilisateur et d’entreprises capables de capturer l’éclair dans une bouteille.
Nvidia a déjà capturé la foudre dans une bouteille. Les GPU se sont révélés être un moteur improbable mais parfait pour l’IA moderne. La question de savoir si une telle chance se reproduira dans l’IA physique, un domaine beaucoup plus compliqué et moins standardisé, reste ouverte.

