Nous avons Tueday, OpenAI a publié de nouveaux outils conçus pour aider les développeurs et les entreprises à créer des agents d’IA – des systèmes automatisés qui peuvent accomplir indépendamment des tâches – en utilisant les propres modèles et cadres d’IA de l’entreprise.
Les outils font partie de l’API des réponses d’Openai, qui permet aux entreprises de développer des agents d’IA personnalisés qui peuvent effectuer des recherches Web, parcourir les fichiers de l’entreprise et naviguer sur des sites Web, un peu comme le produit de l’opérateur d’Openai. L’API des réponses remplace efficacement l’API des assistants d’Openai, que la société prévoit de coucher de soleil au premier semestre 2026.
Le battage médiatique suscite des agents de l’IA a considérablement augmenté ces dernières années malgré le fait que l’industrie technologique a eu du mal à montrer aux gens, voire à définir, ce que sont vraiment les «agents de l’IA». Dans l’exemple le plus récent du battage médiatique d’agent en avance sur le service public, l’effet de papillon de démarrage chinois plus tôt cette semaine est devenu viral pour une nouvelle plate-forme d’agent d’IA appelée Manus que les utilisateurs ont rapidement découvert n’ont pas tenu une grande partie de la promesse de l’entreprise.
En d’autres termes, les enjeux sont élevés pour Openai pour obtenir les bons agents.
« Il est prêt à faire la démonstration de votre agent », a déclaré Olivier Godemont, le chef du produit API d’Openai, à TechCrunch dans une interview. «Pour évoluer un agent, il est difficile de faire en sorte que les gens l’utilisent souvent.»
Plus tôt cette année, OpenAI a introduit deux agents de l’IA dans Chatgpt: Operator, qui navigue sur des sites Web en votre nom, et Deep Research, qui compile des rapports de recherche pour vous. Les deux outils ont offert un aperçu de ce que la technologie agentique peut réaliser, mais a laissé un peu à désirer dans le département «Automy».
Maintenant, avec l’API des réponses, Openai souhaite vendre l’accès aux composants qui alimentent les agents de l’IA, permettant aux développeurs de construire leurs propres applications agentiques de style de recherche et de recherche approfondie. OpenAI espère que les développeurs peuvent créer des applications SOE avec sa technologie d’agent qui se sentent plus autonomes disponibles aujourd’hui.
En utilisant l’API Responsabilités, les développeurs peuvent appuyer sur les mêmes modèles d’IA (en avant-première) sous le capot de l’outil de recherche Web ChatGPT de recherche d’Openai: Recherche GPT-4O et Mini Search GPT-4O. Les modèles peuvent parcourir le Web pour obtenir des réponses aux questions, citant des sources comme le Génération de Théy s’appuie.
OpenAI affirme que la recherche GPT-4O et la Mini Search GPT-4O sont très précises. Sur la référence SimpleQA de l’entreprise, qui mesure la capacité des modèles à répondre à des questions courtes et à la recherche de faits, GPT-4O Search score 90% tandis que GPT-4O Mini Search scores 88% (plus haut, c’est mieux). À titre de comparaison, les modèles de modèles très grands et récemment publiés de GPT-4.5-OpenAI de GPT-4.5.
Le fait que les outils de recherche alimentés par l’IA soient plus accaratés que les modèles d’IA traditionnels n’est pas nécessaire sur la théorie de la surprise, la recherche GPT-4O peut simplement rechercher la bonne réponse. Cependant, la recherche sur le Web ne rend pas les hallucinations dans un problème résolu. Au-delà de leur acccair billard, des outils de recherche d’IA ont également tendance à lutter avec les shorts, les requêtes de navigation (telles que «Score des Lakers aujourd’hui»), et les rapports récents suggèrent que les citations de Chatgpt ne sont pas toujours fiables.
L’API des réponses a également inclus un utilitaire de recherche de fichiers qui peut rapidement numériser des fichiers dans les bases de données d’une entreprise pour récupérer des informations. (OpenAI affirme qu’il ne formera pas de modèles sur ces fichiers.) En outre, les développeurs utilisant l’API de réponses peuvent appuyer sur le modèle d’agent d’utilisation d’ordinateur d’Openai (CUA), qui alimente l’opérateur. Le modèle génère des actions de souris et de clavier, permettant aux développeurs d’automatiser des tâches d’utilisation de l’ordinateur telles que la saisie de données et les flux de travail d’applications.
Les entreprises peuvent éventuellement exécuter le modèle CUA, qui est soulevé dans l’aperçu de la recherche, localement sur leurs propres systèmes, a déclaré Openai. La version grand public de la CUA disponible dans l’opérateur ne peut prendre des mesures que sur le Web.
Pour être clair, l’API des réponses ne résoudra pas tous les problèmes techniques qui affligent les agents de l’IA Teday.
Bien que les outils de recherche de la pow-powdred soient plus accidents que les modèles d’IA traditionnels – un fait qui n’est pas surprenant étant donné qu’ils peuvent simplement rechercher la recherche de droite-Web ne rend pas les hallucinations AI un problème résolu. La recherche GPT-4O obtient toujours 10% des mauvaises questions. Au-delà de leur précision, les outils de recherche d’IA ont également tendance à lutter avec les shorts, les requêtes de navigation (telles que «Score des Lakers aujourd’hui»), et les rapports de réflexion suggèrent que les citations de Chatgpt ne sont pas toujours fiables.
Dans un article de blog fourni à TechCrunch, Openai a déclaré que le modèle CUA n’était «pas encore très fiable pour l’automatisation des tâches sur les systèmes d’exploitation» et qu’il est susceptible de faire des erreurs «inadvertor».
Cependant, Openai a déclaré que ce sont des itérations précoces de leurs outils d’agent, et cela fonctionne constamment pour les améliorer.
Parallèlement à l’API Responses, Openai est en train de réassocier une boîte à outils open source appelée les agents SDK, qui offre aux développeurs des outils gratuits pour intégrer des modèles à leurs systèmes internes, mis en place des garanties et surveiller les agrodites AI à des fins de débogage et d’optimisation. Le SDK Agents est un suivi des sorts à Openai’s Swarm, un cadre d’orchestration multi-agents que la société a publié la fin de l’année.
Godemont a déclaré qu’il espérait que Openai pourra combler le fossé entre les démos et les produits de l’agent d’IA cette année, et que, à son avis, «les agents sont l’application la plus percutante de l’IA qui se produira.» Cela fait écho à un PDG de Proclamation Openai, Sam Altman, réalisé en janvier: que 2025 est l’année où les agents de l’IA entrent sur le marché du travail.
Que 2025 devienne ou non «l’année de l’agent d’âge», les dernières versions d’Openai montrent que la société veut passer des démos d’agent flashy aux outils percutants.

