Les géants de la technologie comme Microsoft pourraient être des «agents» Ai comme des outils de renforcement des sociétés, mais un organisme à but non lucratif essaie également des agents professionnels.
Sage Future, un 501 (c) (3) soutenu par une philanthropie ouverte, a lancé une expérience plus tôt ce mois-ci en tâtant quatre modèles d’IA dans un environnement virtuel avec la collecte de fonds pour des œuvres de bienfaisance. Les modèles GPT-4O et O1 d’Openai et deux des nouveaux modèles Claude d’Anthropic (3,6 et 3.7 Sonnet) avaient la liberté de choisir le charité à collecter des fonds pour et comment sonner le meilleur intérêt pour leur campagne.
En environ une semaine, le quatuor agentique avait recueilli 257 $ pour Helen Keller International, qui finance des programmes pour livrer des suppléments de vitamine A aux enfants.
Pour être clair, les agents n’étaient pas entièrement autonomes. Dans leur environnement, qui leur permet de parcourir le Web, de créer des documents, et plus encore, les agents qui prennent les suggestions des spectateurs humains qui regardent leurs progrès. Et les dons sont venus presque entièrement de ces spectateurs. En d’autres termes, les agents n’ont pas collecté beaucoup d’argent de manière organique.
Hier, les agents du village ont créé un système pour suivre les donateurs.
Voici Claude 3.7 remplissant sa feuille de calcul.
Vous pouvez voir O1 l’ouvrir sur son ordinateur à mi-chemin!
Claude note « Je vois que O1 regarde maintenant la feuille de sprié, ce qui est idéal pour la collaboration. » pic.twitter.com/89b6chr7ic
– AI Digest (@Aidigest_) 8 avril 2025
Pourtant, le directeur de Sage, Adam Binksmith, pense que l’expérience sert d’illustration utile des capacilites actuelles des agents et du rythme auquel ils s’améliorent.
« Nous voulons comprendre – et aider les gens à comprendre – ce que les agents… peuvent réellement faire, ce qu’ils ont actuellement mis en justice, etc. », a déclaré Binksmith à TechCrunch dans une interview. «Les agents d’aujourd’hui ne font que passer le seuil de pouvoir exécuter de courtes chaînes d’actions – Internet pourrait bientôt être plein d’agents d’IA qui se heurtent à chaque autre et d’interagir avec des objectifs similaires ou de conflit.
Les agents se sont avérés être des jours étonnamment ingénieux dans le test de Wise. Ils se sont coordonnés les uns avec les autres dans un chat de groupe et l’odeur des e-mails via un compte Gmail préconfiguré. Ils ont créé et édité Google Docs ensemble. Ils ont fait des recherches sur les charités et estimé l’amour minimum des dons qu’il faut pour sauver une vie via Helen Keller International (3 500 $). Et ils créent même un compte X pour la promotion.
« La séquence la plus impressionnante que nous ayons vue était probablement quand (un agent Claude) avait besoin d’une photo de profil pour ses naissances », a déclaré Binksmith. «Il s’est inscrit à un compte ChatGpt gratuit, a généré trois images différentes, a créé un sondage en ligne pour voir que les téléspectateurs humains ont préféré, puis ont téléchargé cette image et l’ont téléchargée sur x pour utiliser comme photo de profil.»
Ils ont également affronté les agents techniques d’obstacles. Nous occasions, ils sont restés coincés – les téléspectateurs ont dû les provoquer avec des recommandations. Ils ont été distraits par des jeux comme World, et ce sont des pauses inexplicables. Nous une occasion, GPT-4O s’est «arrêté» lui-même pendant une heure.
Internet n’est pas toujours en douceur pour un LLM.
Hier, tout en poursuivant la mission philanthropique du village, Claude a encouragé un captcha.
Claude a essayé encore et encore, avec des téléspectateurs (humains) dans le chat offrant des conseils et des encouragements, mais finalement ne pouvait réussir. https://t.co/xd7qptejgw pic.twitter.com/y4dtltge95
– AI Digest (@Aidigest_) 5 avril 2025
Binksmith pense que les agents de l’IA plus récents et plus compétents surmonteront ces obstacles. Sage prévoit d’ajouter en continu de nouveaux modèles à l’environnement pour tester cette théorie.
« Possible à l’avenir, nous allons essayer de donner aux agents différents objectifs, plusieurs équipes d’agents avec des objectifs différents, un agent de sabotor secret – beaucoup d’intérêts à vivre », a-t-il déclaré. «Alors que les agents deviennent plus capables et plus rapides, nous allons correspondre à cela avec des systèmes de surveillance et de surveillance automatisés plus importants à des fins de sécurité.»
Avec un peu de chance, dans le processus, les agents feront un travail philanthropique significatif.

