Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

Jamie Dimon sur l’IA : « Un jour, nous pourrions tous travailler moins et vivre une vie meilleure »

décembre 7, 2025

L’accélérateur est au sol pour les véhicules autonomes

décembre 7, 2025

Les républicains de l’Indiana sont confrontés à un « processus dangereux et intimidant » alors que le président Trump fait pression pour un redécoupage

décembre 7, 2025
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Microsoft a construit un faux marché pour tester les agents IA – ils ont échoué de manière surprenante
Startups

Microsoft a construit un faux marché pour tester les agents IA – ils ont échoué de manière surprenante

JohnBy Johnnovembre 5, 2025Aucun commentaire3 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Mercredi, des chercheurs de Microsoft ont publié un nouvel environnement de simulation conçu pour tester les agents d’IA, ainsi que de nouvelles recherches montrant que les modèles d’agents actuels peuvent être vulnérables à la manipulation. Menée en collaboration avec l’Arizona State University, la recherche soulève de nouvelles questions sur les performances des agents d’IA lorsqu’ils travaillent sans supervision – et sur la rapidité avec laquelle les entreprises d’IA peuvent tenir leurs promesses d’un avenir agent.

L’environnement de simulation, surnommé « Magentic Marketplace » par Microsoft, est conçu comme une plate-forme synthétique permettant d’expérimenter le comportement des agents IA. Une expérience typique pourrait impliquer un agent client essayant de commander un dîner selon les instructions d’un utilisateur, tandis que des agents représentant divers restaurants s’affrontent pour remporter la commande.

Les premières expériences de l’équipe incluaient 100 agents distincts côté client interagissant avec 300 agents côté entreprise. Le code source du marché étant open source, il devrait être simple pour d’autres groupes d’adopter le code pour mener de nouvelles expériences ou reproduire des résultats.

Ece Kamar, directrice générale du AI Frontiers Lab de Microsoft Research, affirme que ce type de recherche sera essentiel pour comprendre les capacités des agents IA. « Il y a vraiment une question sur la façon dont le monde va changer si ces agents collaborent, se parlent et négocient », a déclaré Kamar. « Nous voulons comprendre ces choses en profondeur. »

La recherche initiale a porté sur un mélange de modèles leaders, notamment GPT-4o, GPT-5 et Gemini-2.5-Flash, et a découvert des faiblesses surprenantes. En particulier, les chercheurs ont découvert plusieurs techniques que les entreprises pourraient utiliser pour manipuler les agents clients et les amener à acheter leurs produits. Les chercheurs ont remarqué une baisse particulière de l’efficacité, car un agent client disposait de plus d’options parmi lesquelles choisir, submergeant ainsi son espace d’attention.

«Nous voulons que ces agents nous aident à traiter de nombreuses options», explique Kamar. « Et nous constatons que les modèles actuels sont vraiment dépassés par le trop grand nombre d’options. »

Les agents ont également rencontré des difficultés lorsqu’on leur a demandé de collaborer vers un objectif commun, ne sachant apparemment pas quel agent devait jouer quel rôle dans la collaboration. Les performances se sont améliorées lorsque les modèles ont reçu des instructions plus explicites sur la manière de collaborer, mais les chercheurs ont toujours considéré que les capacités inhérentes des modèles avaient besoin d’être améliorées.

Événement Techcrunch

San Francisco
|
13-15 octobre 2026

« Nous pouvons instruire les modèles, comme nous pouvons le leur dire, étape par étape », a déclaré Kamar. « Mais si nous testons intrinsèquement leurs capacités de collaboration, je m’attendrais à ce que ces modèles disposent de ces capacités par défaut. »



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleQuelques jours avant que Palantir ne semble confirmer les craintes de tous, les principaux analystes mettaient en garde contre un « dilemme du prisonnier » et une « oscillation de l’IA » sur le marché boursier.
Next Article Le fondateur de Replika lève 20 millions de dollars pour Wabi, le « YouTube des applications »
John
  • Website

Related Posts

L’accélérateur est au sol pour les véhicules autonomes

décembre 7, 2025

Coinbase recommence à intégrer des utilisateurs en Inde et prévoit une rampe d’accès fiduciaire l’année prochaine

décembre 7, 2025

OpenAI dit qu’il a désactivé les suggestions d’applications qui ressemblent à des publicités

décembre 7, 2025

Pat Gelsinger veut sauver la loi de Moore, avec un peu d’aide du gouvernement fédéral

décembre 7, 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Luana López Lara : à 29 ans, la plus jeune milliardaire autodidacte au monde redéfinit la fintech

décembre 6, 2025

Luana López Lara : à 29 ans, la plus jeune milliardaire autodidacte au monde redéfinit la fintech

décembre 6, 2025

La fintech BNPL Klarna présente Tap To Pay pour les transactions en magasin sur les marchés mondiaux

décembre 5, 2025

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

Jamie Dimon sur l’IA : « Un jour, nous pourrions tous travailler moins et vivre une vie meilleure »

décembre 7, 2025

L’accélérateur est au sol pour les véhicules autonomes

décembre 7, 2025

Les républicains de l’Indiana sont confrontés à un « processus dangereux et intimidant » alors que le président Trump fait pression pour un redécoupage

décembre 7, 2025
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2025 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.