
Si une équipe d’ingénieurs humains construisait un navigateur Web à moitié fonctionnel, les gens n’en parleraient pas. Mais lorsque Michael Truell, PDG de la startup de codage Cursor, a publié un article sur X la semaine dernière, il a écrit qu’un essaim d’agents IA avait construit un navigateur doté de « certaines fonctionnalités » tout en fonctionnant sans interruption pendant une semaine sans intervention humaine. Le navigateur s’est rapidement répandu dans l’industrie technologique, accumulant plus de 6 millions de vues.
Pourquoi cela devient-il un sujet brûlant ? Il y a deux raisons principales. La première est que l’IA a toujours eu une capacité d’attention limitée. Au début de ChatGPT, les modèles ne pouvaient durer que quelques secondes sur une tâche. Cette période s’est étendue à quelques minutes, voire quelques heures, pour obtenir de meilleurs modèles. Le projet Cursor prétend être l’un des premiers à permettre à un système d’IA de soutenir un projet logiciel complexe et ouvert pendant une semaine entière sans assistance humaine.
De plus, un seul agent IA est limité à de petites tâches ciblées. Mais des centaines d’agents collaborant sur de grands projets semblent encore futuristes. C’est pourquoi Cursor voulait voir jusqu’où un « orchestre » d’agents d’IA travaillant en équipe pouvait pousser le codage autonome sur des projets qui pouvaient prendre des mois pour une équipe humaine. Un système d’IA sera-t-il suffisamment persistant et suffisamment bien coordonné pour explorer le code, diviser le travail en plusieurs parties, le déboguer et continuer à avancer pendant des jours sans se laisser distraire de la tâche à accomplir ?
Agent IA « Orchestre »
Les chercheurs ont découvert que la réponse est majoritairement oui. Dans l’expérience Cursor, des centaines d’agents ont été organisés en une sorte d’équipe logicielle. Il y avait des « planificateurs », des « travailleurs » et des « juges » qui coordonnaient des millions de lignes de code. Ceci, tant Cursor qu’OpenAI, suggère un avenir proche où l’IA assistera non seulement les employés, mais prendra également en charge des projets entiers. Cela changerait fondamentalement la manière dont les tâches complexes sont exécutées, d’abord dans le développement de logiciels, puis dans d’autres professions.
Des expériences avec des essaims d’IA ont eu lieu ces dernières années. Mais désormais, affirme Cursor, les modèles sont plus intelligents et peuvent rester cohérents sur de plus longues périodes. Les modèles peuvent s’exécuter à des échelles beaucoup plus grandes avec des couches personnalisées qui coordonnent des centaines d’agents et les empêchent de devenir chaotiques.
Jonas Nelle, un ingénieur chez Cursor qui travaille sur des agents d’IA de longue date, a déclaré à Fortune qu’à mesure que les modèles d’IA continuent de s’améliorer, les ingénieurs et les chercheurs doivent repenser leurs hypothèses sur ce que les modèles d’IA peuvent faire tous les quelques mois. Il a admis que « je ne vais pas télécharger et supprimer Chrome aujourd’hui », mais a déclaré que le projet de navigateur était « certainement meilleur que ce que les modèles précédents étaient capables de faire ».
Ces agents de longue durée constituent une frontière importante, a ajouté Bill Chen, un ingénieur OpenAI qui teste et évalue le comportement réel des modèles de l’entreprise. La durée de la tâche et le fait qu’un système d’IA peut effectuer la tâche de manière autonome et cohérente sont « de très bons indicateurs de l’intelligence et de la généralité d’un système », a-t-il déclaré. Le projet Cursor, alimenté par GPT-5.2 d’OpenAI, est « le résultat direct de la volonté de continuer à repousser les limites des fonctionnalités des modèles ». À l’avenir, des tests à plus long terme seront effectués, a-t-il déclaré.
Les essaims d’agents IA ne sont pas prêts pour une utilisation professionnelle
Cependant, ce ne sont pas des systèmes prêts pour la production. En plus d’être bogués et incomplets, les projets qui exécutent des essaims d’agents sur des jours ou des semaines sont coûteux. Même si les prix ont considérablement baissé au cours de l’année écoulée, les emplois à long terme avec des centaines d’agents d’IA peuvent encore s’avérer coûteux.
Il y a aussi des problèmes de sécurité. Les systèmes autonomes suscitent des inquiétudes concernant les vulnérabilités, les fuites de données, etc. et nécessitent de nombreux nouveaux niveaux de contrôle et d’auditabilité.
Mais Chen a déclaré qu’il s’attend à ce qu’il y ait un moment dans un avenir proche où quelque chose comme celui-ci sera « largement consommé et disponible à un coût prohibitif ». Il a expliqué que les progrès étaient continus et que des clés importantes avaient été déverrouillées à chaque étape. Pour l’instant, l’enthousiasme vient du fait qu’il s’agit d’un exemple concret des capacités du modèle et de « la manière dont ce modèle fonctionne dans les évaluations et les benchmarks universitaires et publics ».
Ce changement a surpris même les observateurs de longue date de l’IA. Dans un article récent, le chercheur indépendant Simon Willison prédit que d’ici 2029 quelqu’un construira un navigateur Web complet utilisant principalement l’IA, et affirme que ce n’est même pas surprenant. « Développer un nouveau navigateur Web est l’un des projets logiciels les plus complexes que je puisse imaginer », écrit-il. Le curseur a peut-être accéléré cette chronologie. « J’aurais pu être absent pendant environ trois ans », a déclaré Whisson. « Je dois admettre que je suis assez surpris de voir quelque chose de ce calibre sortir si rapidement. »
Cela témoigne de ce qu’OpenAI et d’autres appellent un « excédent de capacités », l’idée selon laquelle les modèles d’IA les plus sophistiqués peuvent faire bien plus que ceux déployés publiquement, mais avec la bonne combinaison d’outils, de conception de produits et de réductions de coûts, ils peuvent soudainement devenir utilisables à grande échelle. Ainsi, même si des outils comme le navigateur Cursor ne sont pas encore prêts à être diffusés aux heures de grande écoute, leur trajectoire est claire.
Cet article a été initialement publié sur Fortune.com

