Openai a annoncé mercredi le lancement de O3 et O4-Mini, de nouveaux modèles de raisonnement en IA conçus pour faire une pause et résoudre les questions avant Livor.
La société appelle O3 son modèle de raisonnement le plus avancé de tous les temps, surpassant les modèles précédents de l’entreprise sur les tests mesurant les capacités de mathématiques, de codage, de raisonnement, de science et de compréhension visuelle. Pendant ce temps, O4-Minini offre ce que dit OpenAI, c’est un compromis compétitif entre le prix, la vitesse et les performances – trois facteurs que les développeurs considèrent souvent lors du choix d’un modèle d’IA pour alimenter leurs applications.
Contrairement aux modèles de raisonnement précédent, O3 et O4-MinI peuvent générer à l’aide d’outils dans Chatgpt tels que la navigation Web, l’exécution du code Python, le traitement d’image et la génération d’images. À partir d’aujourd’hui, les modèles, plus une variante d’O4-MinI appelée «O4-MinI-High» qui passe plus de temps à créer des réponses pour améliorer sa fiabilité, sont apaisables pour les abonnés à Openai, plus, plus et des plans d’équipe.
Les nouveaux modèles font partie des efforts d’Openai pour battre Google, Meta, Xai, Anthropic et Deepseek dans la course mondiale de l’IA Cutthroat. Alors qu’Openai a été le premier à publier un modèle de raisonnement d’IA, O1, les concurrents ont rapidement suivi avec des versions de leur jeu ou dépassant les performances de la gamme d’Openai. En fait, les modèles de raisonnement ont commencé à dominer le domaine alors que les laboratoires AI cherchent à expliquer davantage de performances de leurs systèmes.
O3 n’a presque pas été libéré dans Chatgpt. Le PDG d’OpenAI, Sam Altman, a signalé en février que la société avait l’intention de consacrer plus de ressources à une alternative sophistiquée qui incorporait la technologie d’O3. Mais la pression concurrentielle a apparemment incité Openai à inverser la course à la fin.
OpenAI dit que O3 atteint des performances de pointe sur SWE-Bench vérifiées (sans échafaudage personnalisé), un test mesurant les capacités de codage, en saillant 69,1%. Le modèle O4-Mini atteint des performances similaires, marquant 68,1%. Le prochain meilleur modèle d’OpenAI, O3-Mini, a marqué 49,3% au test, tandis que Claude 3.7 Sonnet a marqué 62,3%.
OpenAI affirme que O3 et O4-Mini sont ses premiers modèles qui peuvent «penser avec des images». En pratique, les utilisateurs peuvent télécharger des images sur Chatgpt, tels que des croquis ou des diagrammes de tableau blanc à partir de PDF, et les modèles analyseront les images pendant leur phase de «chaîne de pensées» avant. Grâce à cette nouvelle capacité, O3 et O4-MinI peuvent comprendre des images floues et de faible qualité et peuvent effectuer des tâches telles que le zoom ou les images rotatives Asy Raison.
Au-delà des capacités de prévision de l’image, O3 et O4-MinI peuvent exécuter et exécuter le code Python directement dans votre navigateur via la fonctionnalité Canvas de Chatgpt, et rechercher le Web lorsqu’on lui a posé des questions sur les événements actuels.
En plus de Chatgpt, les trois modèles-O3, O4-MinI et O4-MinI-High-Will seront disponibles via les points de terminaison orientés en fonction des développeurs d’OpenAI, l’API de complétion de chat et l’API de réponses, permettant aux ingénieurs de créer des applications avec les modèles de l’entreprise à des tarifs basés sur l’utilisation.
OpenAI facture aux développeurs un prix relativement bas pour O3, compte tenu de ses performances améliorées, à 10 $ par million de jetons d’entrée (environ 750 000 mots, plus longtemps que la série Lord of the Rings) et 40 $ par million de jetons de sortie. Pour O4-Minini, OpenAI facture de la même manière que O3-Minini, 1,10 $ par million de jetons d’entrée et 4,40 $ par million de jetons de sortie.
Dans les semaines à venir, Openai dit qu’elle prévoit de publier O3-Pro, une version d’O3 qui utilise plus de ressources informatiques pour produire ses réponses, exclusivement pour les abonnés ChatGpt Pro.
Le PDG d’OpenAI, Sam Altman, a indiqué que O3 et O4-MinI pourraient être ses derniers modèles de raisonnement d’IA autonomes dans le chatppt avant GPT-5, un modèle qui, selon la société, unifiera les modèles traditionnels comme GPT-4.1 avec ses modèles de raisonnement.