
Alors que les vidéos de robots effectuant du parkour et des backflips dominent les réseaux sociaux, les initiés du secteur suggèrent que de tels exploits acrobatiques sont un indicateur trompeur de progrès. Les dirigeants de l’industrie présents à la conférence Fortune Brainstorming AI à San Francisco début décembre ont fait valoir que la véritable révolution en matière de robotique n’est pas l’agilité physique, mais la capacité des robots à « penser » par eux-mêmes, ce qui signifie qu’ils se rapprochent enfin de la maîtrise de tâches banales mais apparemment difficiles comme ouvrir des portes et monter des escaliers.
Depuis 70 ans, la robotique s’appuie sur un paradigme spécifique. Autrement dit, les humains intelligents utilisaient des mathématiques complexes pour préprogrammer des machines afin d’effectuer des tâches spécifiques. Cette approche est désormais dépassée, ont fait valoir Stephanie Zhan, partenaire de Sequoia Capital, et Deepak Pathak, PDG de Skild AI, lors d’une conversation avec Allie Garfinkle de Fortune. L’industrie connaît un changement massif où les robots apprennent directement à partir des données et de l’expérience plutôt que de suivre un code rigide, similaire aux grands modèles de langage (LLM) derrière des outils comme ChatGPT.
« Il s’agit d’un changement dans la mesure où la robotique est traditionnellement pilotée par l’intelligence humaine », a déclaré Pathak, soulignant que la nouvelle vague sera définie par des modèles capables de généraliser et d’apprendre. « Ce qui a changé, c’est que ces modèles et robots peuvent désormais apprendre à partir des données. »
En juillet 2024, Zhang a écrit sur le blog de Sequoia sur les solides antécédents de Pathak dans le domaine et son talent caractéristique pour la vision par ordinateur et l’apprentissage profond en tant que PDG de la robotique. En comparaison, la robotique traditionnelle se concentre sur la collecte de données spécifiques pour entraîner les robots à des tâches spécifiques. Pathak et son partenaire Abhinav Gupta ont exploité des données à grande échelle pour créer le modèle fondamental. Pathak, originaire d’une petite ville d’Inde, a fait la une des journaux nationaux lorsqu’il a été accepté à l’Institut indien de technologie de Kanpur sans quitter sa ville rurale natale, a écrit Zang. Il a appris la programmation en écrivant du code à la maison et a passé son temps limité à exécuter des programmes dans les cafés locaux. Il a ensuite obtenu son doctorat. en IA de Berkeley, tout en rejoignant simultanément Facebook AI Research et co-fondateur de Skild.
La conversation entre Zhang, Pathak et Garfinkle a abordé un paradoxe de l’intelligence artificielle connu sous le nom de paradoxe de Moravec. En d’autres termes, ce qui semble difficile est souvent facile, et ce qui semble facile est incroyablement difficile.
Pourquoi un backflip est plus facile qu’une porte
Un robot qui effectue un backflip doit essentiellement contrôler son corps dans l’espace libre, un problème physique dans lequel les ordinateurs excellent depuis des décennies. « Il est en fait beaucoup plus facile de programmer un robot pour qu’il fasse un saut périlleux que de le programmer pour monter des escaliers », a noté Garfinkle, et les deux panélistes étaient d’accord.
Le véritable défi, et le Saint Graal de « l’intelligence physique », réside dans l’interaction avec le monde réel chaotique. Lorsqu’il monte les escaliers ou ramasse du verre, le robot doit continuellement utiliser sa vision pour modifier son comportement en réponse aux changements de l’environnement. Ce « bon sens sensorimoteur » est à la base de l’intelligence humaine générale, et c’est le mur que les nouveaux logiciels « cérébraux » tentent de briser.
Les investisseurs et les dirigeants y voient une opportunité de marché comparable à la récente croissance explosive de l’IA générative. Zhan a souligné que, tout comme OpenAI a ouvert le marché du travail fondé sur la connaissance numérique, des entreprises comme Pathak’s Skild visent à ouvrir le marché à tout le travail manuel. L’objectif est de créer un « logiciel généralement intelligent » qui puisse agir comme le cerveau de tout le matériel robotique et réduire les coûts de plusieurs ordres de grandeur.
Mais contrairement au monde du logiciel, la robotique est confrontée à un obstacle unique : le manque de données. Bien que le LLM ait été formé sur Internet, il n’existe pas de base de données équivalente aux interactions physiques du robot. Pathak a fait valoir que les premières entreprises à déployer un « volant de données » dans lequel les robots de terrain génèrent les données nécessaires pour rendre les systèmes plus intelligents gagneront.
Pour les consommateurs qui se demandent quand les robots feront leur lessive, le calendrier reste progressif. Pathak et Zhang ont prédit que les robots se généraliseraient d’abord dans les milieux industriels et les environnements « semi-structurés » tels que les hôtels et les hôpitaux, avant de s’installer dans les environnements plus chaotiques des maisons privées.
Malgré les inquiétudes concernant les pertes d’emplois, ils ont fait valoir que la technologie est nécessaire pour répondre aux « trois S » de l’avenir : la sécurité, la rareté et l’évolution sociale. Les robots sont désormais prêts à assumer des tâches qui obligent les humains à risquer leur vie et leur santé. De plus, les robots pourraient occuper des emplois cols bleus essentiels, car il existe actuellement des millions d’emplois non pourvus en raison de pénuries de main-d’œuvre. À terme, nous espérons voir un changement dans la société où le travail dangereux et monotone deviendra facultatif et où les gens pourront se concentrer sur le travail qu’ils aiment.
Cet article a été initialement publié sur Fortune.com

