Vendredi, le créateur de Claude Code, Boris Cherny, a fait une apparition à la conférence @Scale de Meta et, étonnamment, la première question du public portait sur les boucles.
« Les boucles sont-elles le prochain cycle de battage médiatique », a demandé l’interrogateur, « ou sont-elles réelles ? »
La réponse de Cherny a été catégorique : « Oui, ils sont réels. »
« Il y a deux ans, nous écrivions le code source à la main. Nous avons commencé à faire la transition pour que les agents écrivent le code. Et maintenant, nous arrivons au point où les agents invitent les agents à écrire ensuite le code », a-t-il poursuivi. « Aussi important que soit le passage du code source aux agents, les boucles sont tout aussi importantes et constituent une étape tout aussi importante.
Plus tard dans la conférence (vers 32h00 dans la vidéo YouTube publiée ci-dessus), Cherny a précisé les boucles qu’il continue d’exécuter dans son propre travail. Un agent recherche continuellement des moyens d’améliorer l’architecture du code, tandis qu’un autre recherche des abstractions dupliquées pouvant être unifiées. Ils soumettent des pull request comme n’importe quel autre codeur, et comme le code change constamment, ils ne s’arrêtent jamais.
C’est une idée puissante, surtout avec un personnage aussi important que Cherny derrière elle. Avec le passage à l’IA agentique, l’objectif de la plupart des utilisateurs a été de gérer leurs agents du mieux possible : établir des objectifs clairs, vérifier des unités de progrès distinctes et ne pas les laisser s’éloigner trop au-delà de l’invite. La boucle va encore plus loin en autorisant un essaim d’agents à travailler continuellement en arrière-plan, sans fin. Il faut beaucoup faire confiance à l’IA, mais avec l’amélioration rapide des modèles, cela pourrait être la prochaine étape pour permettre à l’IA de gérer le travail réel.
La première chose à reconnaître est que ce n’est pas entièrement nouveau. Les boucles récursives – des fonctions qui s’appellent elles-mêmes pour répéter une action, ainsi qu’une condition qui arrête la boucle – sont un pilier des cours d’introduction à l’informatique. Ces boucles suivent une logique non déterministe (c’est-à-dire qu’il s’agit d’un sous-agent qui choisit quand arrêter la boucle au lieu d’une condition claire) mais la même approche de base est à l’œuvre. Dès que les programmeurs ont commencé à utiliser l’IA pour accomplir des tâches, une version de la boucle récursive, avec l’IA supervisant l’IA, allait inévitablement apparaître.
Contrairement à l’informatique classique, les boucles agents peuvent être d’une simplicité exaspérante. L’une des astuces les plus populaires est la Ralph Loop (du nom de Ralph Wiggum), qui résume essentiellement tout le travail effectué par le modèle et demande s’il a atteint son objectif. C’est une façon de gérer la perte des modèles d’IA lorsqu’ils fonctionnent trop longtemps – essentiellement en faisant rebondir le modèle d’avant en arrière jusqu’à ce que la tâche soit terminée.
Une autre façon de concevoir les boucles est de s’inscrire dans le cadre de la poussée générale en faveur d’un calcul plus intensif au temps de test. Comme l’a observé Noam Brown, chercheur à OpenAI, plus tôt ce mois-ci, les modèles contemporains peuvent résoudre presque tous les problèmes si vous leur lancez suffisamment de calculs. Cela signifie qu’une façon de garantir qu’un problème est résolu est de continuer à y lancer des calculs jusqu’à ce qu’il soit terminé. Cela est particulièrement vrai pour les problèmes complexes tels que l’amélioration d’une base de code, où le modèle peut simplement continuer à apporter des améliorations incrémentielles jusqu’à ce qu’il atteigne un seuil donné. Ou, comme dans l’exemple de Cherny, il peut simplement continuer à apporter des améliorations progressives aussi longtemps qu’il y a du calcul à consacrer.
Si cela semble cher, ça devrait le faire. Comme l’IA agentique avant elle, les boucles d’IA brûlent les jetons beaucoup plus rapidement que les simples chatbots de questions-réponses – et comme le but est de maintenir la boucle en marche tout le temps, il n’y a pas de plafond quant au montant que vous pouvez dépenser. C’est bien pour Anthropic, qui se consacre en fin de compte à la vente de jetons, mais pour tout le monde, cela peut être une façon de travailler coûteuse.
Néanmoins, en fonction du problème que la boucle agentique tente de résoudre et de la bonne configuration permettant de surveiller les dépenses en jetons, la dérive et d’autres problèmes classiques d’IA, les avantages pourraient être suffisamment stupéfiants pour compenser les coûts.
Lorsque vous achetez via des liens dans nos articles, nous pouvons gagner une petite commission. Cela n’affecte pas notre indépendance éditoriale.

