OpenAI annonce un nouvel «agent» d’IA conçu pour aider les gens à mener des recherches complexes approfondies à l’aide de Chatgpt, la plate-forme de chatbot AI-Power de la société.
Assez approprié, cela s’appelle Deep Research.
Openai a déclaré dans un article de blog publié dimanche que cette nouvelle capatibilité avait été conçue pour «les personnes qui font des connaissances intensives dans des domaines tels que la finance, la science, la politique et l’ingénierie et ont besoin d’une recherche approfondie, précise et fiable». Il pourrait également être utile, a ajouté l’entreprise, pour quiconque effectue des «achats qui nécessitent généralement des recherches minutieuses, comme les voitures, les appareils électroménagers et la meuble».
Basalely, Chatgpt Deep Research est destiné aux cas où vous voulez juste une réponse ou un résumé rapide, mais il faut plutôt considérer assidûment les informations à partir de plusieurs sites Web et d’autres sources.
Openai a déclaré que cela mettait des recherches approfondies à la disposition des utilisateurs de ChatGpt Pro aujourd’hui, limitées à 100 requêtes par mois, avec la prise en charge de plus et des utilisateurs de l’équipe à venir, suivis de l’entreprise. (OpenAI cible un déploiement plus dans environ un mois, a déclaré la société, et les limites de requête pour les utilisateurs payants devraient bientôt être «nordicieusement plus élevées».) C’est un lancement géo-ciblé; Openai n’avait aucun calendrier de libération à partager pour les clients de Chatgpt au Royaume-Uni, en Suisse et dans le domaine économique européen.

Pour utiliser Chatgpt Deep Research, vous sélectionnez simplement la «recherche profonde» dans le compositeur, puis entrerez une requête, avec la possibilité de joindre des fichiers ou des feuilles de calcul. (C’est une expérience Web-Ny pour l’instant, avec l’intégration des applications mobiles et de bureau à la fin du mois.) La recherche approfondie peut? .
Actuellement, les résultats de Chatgpt Deep Research sont uniquement en texte. Mais Openai a déclaré que cela intéresse l’ajout d’images embarquées, de visualisations de données et d’autres sorties «analytiques» bientôt. La feuille de route est également la possibilité de connecter des «sources de données plus spécialisées», notamment des ressources «basées sur l’abonnement» et des ressources internes, a ajouté OpenAI.
La grande question est, à quel point la recherche profonde est-elle précise? L’IA est imparfaite, après tout. Il est sujet aux hallucinations et à d’autres types d’erreurs qui pourraient être nuisibles spéciales dans un scénario de «recherche profonde». C’est peut-être pourquoi Openai a déclaré que chaque sortie de recherche profonde de Chatgpt sera «entièrement en forme, avec des devis clairs et un résumé de (la) réflexion, ce qui facilite la référence et la vérification des informations.
Le jury est là où ces atténuations seront suffisantes pour lutter contre les erreurs de l’IA. La fonctionnalité de recherche Web d’OpenAAI alimentée par AI dans Chatgpt, la recherche Chatgpt, ne fait pas rarement des gaffes et donne de mauvaises réponses aux questions. Les tests de TechCrunch ont révélé que la recherche ChatGpt a produit des résultats moins utiles que la recherche Google pour certaines requêtes.
Pour renforcer l’accident de Deep Research, OpenAI utilise une version spéciale de son modèle d’IA «raisonnement» O3 récemment annoncé qui a été formé par l’apprentissage du renforcement sur les «tâches du monde réel nécessitant une utilisation du navigateur et des outils Python». Le renforcement de l’apprentissage «enseigne» essentiellement un modèle via des essais et des erreurs pour atteindre un objectif spécifique. À mesure que le modèle se rapproche de l’objectif, il reçoit des «récompenses» virtuelles qui, idéalement, l’améliorent à la tâche à l’avenir.
Il a indiqué que cette version du modèle OpenAI O3 est « optimisée pour la navigation sur le Web et l’analyse des données », ajoutant qu’il «tire un raisonnement pour rechercher, interpréter et analyser des amants massifs de texte, d’images et de PDF sur Internet, pivotant si nécessaire dans Réaction à des informations qu’il encourage (…) Le modèle est également capable de parcourir les fichiers téléchargés, de tracer et d’itérer sur les graphiques à l’aide de l’outil Python, d’intégrer les graphiques et les images générés du site Web est responsable, et citer des phrases spécifiques à partir de son depuis son de son de ses sources. «

La société a déclaré qu’elle avait testé Chatgpt Deep Research en utilisant le dernier examen de l’humanité, une évaluation qui inclut plus de 3 000 questions de niveau expert dans une variété de domaines académiques. Le modèle O3 alimentant les recherches profondes a réalisé une acjeracy accu de 26,6%, qui pourrait ressembler à une note défaillante – mais le dernier examen de l’humanité a été conçu pour être plus difficile que les autres repères pour rester en avance sur les progrès du modèle. Selon OpenAI, le modèle de recherche en profondeur O3 a été en avance sur la pensée Gemini (6,2%), Grok-2 (3,8%) et le propre GPT-4O d’OpenAI (3,3%).
Pourtant, Openai note que la recherche profonde de Chatgpt a des limites, faisant parfois des erreurs et des infections incorrectes. Des recherches approfondies peuvent avoir du mal à distinguer les informations faisant autorité des rumeurs, a déclaré la société, et ne parvient souvent pas à transmettre lorsqu’elle est incertaine de quelque chose – et elle peut également faire des erreurs de mise en forme dans les rapports et les citations.
Pour quiconque s’inquiète de l’impact de l’IA générative sur les étudiants, ou de toute personne essayant de trouver des informations en ligne, ce type de sortie approfondie et bien cité semble probablement plus attrayant qu’un résumé de chatbot trompeusement simple sans citations. Mais nous verrons où la plupart des utilisateurs soumettront réellement la sortie à une analyse réelle et à la double vérification, ou s’ils le simples comme un texte plus professionnel pour copier-paaste.
Et si tout cela semble familier, Google a en fait anondé une fonctionnalité d’IA similaire avec exactement le même nom il y a moins de deux mois.