En raison de la presse de ses concurrents, notamment la société d’IA chinoise Deepseek, Openai modifie la façon dont son modèle d’information sur les nouvelles, O3-Mini, communique le processus de «pensée» étape par étape.
Jeudi, Openai a sécurisé que les utilisations gratuites et payantes de Chatgpt, la plate-forme de chatbot AI-Power de la société, verra une «chaîne de pensée» mise à jour qui montre davantage des étapes de «raisonnement» du modèle et comment elle arrive aux années. Les abonnés à des plans de chatppt premium qui utilisent O3-MinI dans la configuration du «raisonnement élevé» verront également cette lecture mise à jour, selon OpenAI.
« Nous introduisons une mise à jour (chaîne de pensée) pour O3-Mini conçue pour faciliter la compréhension des gens de la façon dont le modèle pense », a déclaré un porte-parole d’OpenAI à TechCruch par e-mail. «Avec cette mise à jour, vous pourrez suivre le raisonnement du modèle, vous donnant plus de clarté et de confiance dans ses responsabilités.»

Des modèles de raisonnement comme O3-MinI se vérifient soigneusement avant de donner des résultats, ce qui les aide à éviter certains des pièges qui décrochent normalement les modèles. Le compromis est que les modèles de raisonnement mettent un peu pour arriver à des solutions – les secondes à quelques minutes changent.
Le modèle R1 de Deepseek, un modèle de «raisonnement» dans le sens d’O3-MINI, révèle son processus de réflexion complet, que de nombreux chercheurs d’IA affirment que c’est l’approbation préférée. En plus de rendre le modèle plus facile à étudier, les étapes de raisonnement offrent une meilleure expérience utilisateur dans certaines situations, aidant à indiquer quand le modèle pourrait être sur la bonne voie – ou mal -.
Openai avait choisi de ne pas montrer les étapes de raisonnement complètes pour O3-Mini et ses prédiasseurs, O1 et O1-Mini, en partie pour des raisons complètes. Au lieu de cela, les utilisateurs n’ont vu que des résumés des étapes de raisonnement – des résumés qui étaient parfois erronés.
Lorsque nous avons informé les gens sur 🍓 avant la sortie d’O1-Preview, voir le Cot Live était généralement le moment «aha» pour eux qui ont clairement indiqué que cela allait être un gros problème. Ce ne sont pas les COTS bruts, mais c’est un grand pas de plus et je suis heureux que nous puissions partager cette expérience avec le monde. https://t.co/72zpprhmfk
– Noam Brown (@polynovial) 6 février 2025
Openai ne montre toujours pas les étapes de raisonnement d’O3-Mini, mais la société a déclaré qu’elle avait «trouvé un équilibre»: O3-Mini peut «penser librement», puis organiser ses «pensées» en subsides plus détaillées.
« Pour améliorer la clarté et la sécurité, nous avons ajouté une étape supplémentaire post-noir où le modèle passe en revue la chaîne brute de pensée, en supprimant tout contenu dangereux, puis simplifie toutes les idées complexes », a poursuivi le porte-parole d’OpenAI. «De plus, cette étape post-approche permet aux utilisateurs non anglophones de recevoir la chaîne de pensée dans leur langue maternelle, créant une expérience plus accessible et amicale.»
Dans un AMA de Reddit la semaine dernière, Kevin Weil, directeur des produits d’Openai, Hinéd, que le changement arrivait.
« Nous travaillons à montrer un tas de plus que ce que nous ne montrons aujourd’hui – (montrant le processus de réflexion du modèle) sera très, très bientôt », a-t-il déclaré. « TBD sur tous – montrant toute la chaîne de pensée mène à une distillation concurrentielle, mais nous savons également que les gens (au moins les utilisateurs de puissance) le veulent, donc bien trouver la bonne façon de l’équilibrer. »
TechCrunch a une newsletter axée sur l’IA! Inscrivez-vous ici pour l’obtenir dans votre boîte de réception tous les mercredis.