OpenAI a lancé O3-Pro, un modèle d’IA qui prétend que la société est le plus capable à ce jour.
O3-Pro est une version d’Openai d’O3, un modèle de raisonnement que la startup a lancé plus tôt cette année. Contrairement aux modèles d’IA conventionnels, les modèles de raisonnement résistent à des problèmes étape par étape, ce qui leur permet d’effectuer plus de liabop dans les domaines comme la physique, les mathématiques et le codage.
O3-Pro est disponible pour ChatGpt Pro et les utilisateurs de l’équipe à partir de mardi, en remplacement du modèle O1-Pro. Les utilisateurs de l’entreprise et de l’EDU auront accès la semaine suivante, explique Openai. O3-Pro est également en direct dans l’API développeur d’Openai depuis cet après-midi.
O3-Pro est au prix de 20 $ par million de jetons d’entrée et 80 $ par million de jetons de sortie dans l’API. Les jetons d’entrée sont des jetons alimentés dans le modèle, tandis que les jetons de sortie sont des jetons que le modèle génère sur les jetons d’entrée.
Un million de jetons d’entrée équivaut à environ 750 000 mots, un peu de longueur que la «guerre et paix».
«Dans les évaluations d’experts, les examinateurs sont constitués de préfe sur l’O3 dans chaque catégorie testée et en particulier dans des domaines clés comme la science, l’éducation, la programmation, les affaires et l’aide à l’écriture», écrit Openai dans un Changelog. «Les examinateurs ont également évalué l’O3-Pro consistant à plus de clarté, de compréhension, de suivi des instructions et de précision.»
O3-PRO a accès aux outils, selon OpenAI, lui permettant de rechercher le Web, d’analyser les fichiers, de raison sur les entrées visuelles, d’utiliser Python, de personnaliser ses réponses en tirant la mémoire, etc. En tant qu’inconvénient, le modèle prend généralement plus de temps que O1-Pro à terminer, selon Openai.
O3-Pro a d’autres limites. Les chats temporaires avec le modèle dans Chatgpt sont désactivés pour l’instant tandis qu’OpenAI résout un «problème technique». O3-Pro ne peut pas générer d’images. Et Canvas, la fonctionnalité d’espace de travail à pow d’OpenAI, n’est pas prise en charge par O3-Pro.
Du côté positif, O3-Pro obtient des scores impressionnants dans des repères d’IA populaires, selon les tests internes d’Openai. Nous aimons 2024, qui évalue mieux les compétences en mathématiques d’un modèle, O3-Pro score mieux que le modèle d’IA le plus performant de Google, Gemini 2.5 Pro. O3-PRO bat également Claude 4 Opus récemment publié d’Anthropic sur GPQA Diamond, un test de connaissances scientifiques au niveau du doctorat.

