OpenAI a lancé jeudi son dernier modèle frontière, GPT-5.2, dans un contexte de concurrence croissante de Google, le présentant comme son modèle le plus avancé à ce jour et conçu pour les développeurs et un usage professionnel quotidien.
Le GPT-5.2 d’OpenAI arrive aux utilisateurs et développeurs payants de ChatGPT via l’API en trois versions : Instantané, un modèle optimisé en termes de vitesse pour les requêtes de routine telles que la recherche d’informations, l’écriture et la traduction ; Réflexif, qui excelle dans les travaux structurés complexes comme le codage, l’analyse de longs documents, les mathématiques et la planification ; et Pro, le modèle haut de gamme visant à offrir une précision et une fiabilité maximales pour les problèmes difficiles.
« Nous avons conçu la version 5.2 pour offrir encore plus de valeur économique aux utilisateurs », a déclaré jeudi Fidji Simo, directeur produit d’OpenAI, lors d’un point de presse avec des journalistes. « Il est préférable de créer des feuilles de calcul, de créer des présentations, d’écrire du code, de percevoir des images, de comprendre un contexte long, d’utiliser des outils, puis de relier des projets complexes en plusieurs étapes. »
GPT-5.2 atterrit au milieu d’une course aux armements avec Gemini 3 de Google, qui est en tête du classement de LMArena dans la plupart des benchmarks (à l’exception du codage – que Claude Opus-4.5 d’Anthropic a toujours verrouillé).
Au début du mois, The Information a rapporté que le PDG Sam Altman avait publié une note interne « code rouge » à l’intention du personnel dans un contexte de baisse du trafic de ChatGPT et de craintes de perdre des parts de marché au profit de Google. Le code rouge appelait à un changement de priorités, notamment en s’arrêtant sur des engagements tels que l’introduction de publicités et en se concentrant plutôt sur la création d’une meilleure expérience ChatGPT.
GPT-5.2 est la volonté d’OpenAI de reprendre son leadership, même si certains employés auraient demandé que la version du modèle soit repoussée afin que l’entreprise puisse avoir plus de temps pour l’améliorer. Et malgré les indications selon lesquelles OpenAI concentrerait son attention sur les cas d’utilisation grand public en ajoutant davantage de personnalisation à ChatGPT, le lancement de GPT-5.2 semble renforcer ses opportunités d’entreprise.
La société cible spécifiquement les développeurs et l’écosystème d’outils, dans le but de devenir la base par défaut pour la création d’applications basées sur l’IA. Plus tôt cette semaine, OpenAI a publié de nouvelles données montrant que l’utilisation par les entreprises de ses outils d’IA a considérablement augmenté au cours de l’année écoulée.
Événement Techcrunch
San Francisco
|
13-15 octobre 2026
Cela survient alors que Gemini 3 est devenu étroitement intégré à l’écosystème de produits et de cloud de Google pour les flux de travail multimodaux et agents. Google a lancé cette semaine des serveurs MCP gérés qui facilitent la connexion de ses services Google et Cloud tels que Maps et BigQuery pour les agents. (Les MCP sont les connecteurs entre les systèmes d’IA, les données et les outils.)
OpenAI affirme que GPT-5.2 établit de nouveaux scores de référence en matière de codage, de mathématiques, de sciences, de vision, de raisonnement à long contexte et d’utilisation d’outils, ce qui, selon la société, pourrait conduire à « des flux de travail agents plus fiables, un code de qualité production et des systèmes complexes qui fonctionnent dans de vastes contextes et des données du monde réel ».
Ces capacités le mettent en concurrence directe avec le mode Deep Think de Gemini 3, qui a été présenté comme une avancée majeure en matière de raisonnement ciblant les mathématiques, la logique et les sciences. Sur le propre tableau de référence d’OpenAI, GPT-5.2 Thinking devance Gemini 3 et Claude Opus 4.5 d’Anthropic dans presque tous les tests de raisonnement répertoriés, des tâches d’ingénierie logicielle du monde réel (SWE-Bench Pro) et des connaissances scientifiques de niveau doctorat (GPQA Diamond) au raisonnement abstrait et à la découverte de modèles (suites ARC-AGI).
Aidan Clark, responsable de la recherche, a déclaré que de meilleurs résultats en mathématiques ne se limitent pas à résoudre des équations. Le raisonnement mathématique, a-t-il expliqué, permet de savoir si un modèle peut suivre une logique en plusieurs étapes, maintenir des chiffres cohérents dans le temps et éviter des erreurs subtiles qui pourraient s’aggraver avec le temps.
« Ce sont toutes des propriétés qui comptent vraiment dans un large éventail de charges de travail différentes », a déclaré Clark. « Des choses comme la modélisation financière, les prévisions, l’analyse des données. »
Au cours du briefing, Max Schwarzer, responsable du produit OpenAI, a déclaré que GPT-5.2 « apporte des améliorations substantielles à la génération de code et au débogage » et peut parcourir étape par étape les mathématiques et la logique complexes. Les startups de codage comme Windsurf et CharlieCode, a-t-il ajouté, font état de « performances de codage d’agents de pointe » et de gains mesurables sur des flux de travail complexes en plusieurs étapes.
Au-delà du codage, Schwarzer a déclaré que les réponses GPT-5.2 Thinking contiennent 38 % d’erreurs en moins que son prédécesseur, ce qui rend le modèle plus dépendant de la prise de décision, de la recherche et de l’écriture quotidiennes.
GPT-5.2 semble être moins une réinvention qu’une consolidation des deux dernières mises à niveau d’OpenAI. GPT-5, abandonné en août, était une réinitialisation qui a jeté les bases d’un système unifié avec un routeur permettant de basculer le modèle entre un modèle par défaut rapide et un mode « Pensée » plus profond. Le GPT-5.1 de novembre visait à rendre ce système plus chaleureux, plus conversationnel et mieux adapté aux tâches d’agent et de codage. Le dernier modèle, GPT-5.2, semble améliorer toutes ces avancées, ce qui en fait une base plus fiable pour une utilisation en production.
Pour OpenAI, les enjeux n’ont jamais été aussi élevés. L’entreprise a pris des engagements à hauteur de 1 400 milliards de dollars pour le développement de l’infrastructure d’IA au cours des prochaines années afin de soutenir sa croissance – des engagements qu’elle a pris alors qu’elle avait encore l’avantage du premier arrivé parmi les entreprises d’IA. Mais maintenant que Google, qui était à la traîne au début, va de l’avant, ce pari pourrait être à l’origine du « code rouge » d’Altman.
L’intérêt renouvelé d’OpenAI pour les modèles de raisonnement est également une approche risquée. Les systèmes derrière ses modes de réflexion et de recherche approfondie sont plus coûteux à exécuter que les chatbots standards, car ils nécessitent plus de calcul. En doublant ce type de modèle avec GPT-5.2, OpenAI pourrait créer un cercle vicieux : dépenser plus en calcul pour remporter le classement, puis dépenser encore plus pour maintenir ces modèles coûteux à fonctionner à grande échelle.
OpenAI dépenserait déjà plus en calcul qu’il ne l’avait laissé entendre auparavant. Comme TechCrunch l’a récemment rapporté, la plupart des dépenses d’inférence d’OpenAI (l’argent dépensé en calcul pour exécuter un modèle d’IA entraîné) sont payées en espèces plutôt qu’en crédits cloud, ce qui suggère que les coûts de calcul de l’entreprise ont augmenté au-delà de ce que les partenariats et les crédits peuvent subventionner.
Au cours de l’appel, Simo a suggéré qu’à mesure qu’OpenAI évolue, il est en mesure d’offrir davantage de produits et de services afin de générer plus de revenus pour payer des calculs supplémentaires.
« Mais je pense qu’il est important de placer cela dans le grand arc de l’efficacité », a déclaré Simo. « Aujourd’hui, vous obtenez beaucoup plus d’intelligence pour la même quantité de calcul et le même montant d’argent qu’il y a un an. »
Malgré l’accent mis sur le raisonnement, une chose qui manque dans le lancement d’aujourd’hui est un nouveau générateur d’images. Altman aurait déclaré dans son mémo code rouge que la génération d’images serait une priorité clé à l’avenir, en particulier après que Nano Banana de Google (le surnom du modèle Gemini 2.5 Flash Image de Google) ait connu un moment viral après sa sortie en août.
Le mois dernier, Google a lancé Nano Banana Pro (alias Gemini 3 Pro Image), une version améliorée avec un rendu de texte encore meilleur, une connaissance du monde et une ambiance étrange, réelle et inédite pour ses photos. Il s’intègre également mieux dans les produits Google, comme l’a démontré la semaine dernière son apparition dans des outils et des flux de travail tels que Google Labs Mixboard pour la génération automatisée de présentations.
OpenAI aurait prévu de lancer un autre nouveau modèle en janvier avec de meilleures images, une vitesse améliorée et une meilleure personnalité, bien que la société n’ait pas confirmé ces plans jeudi.
OpenAI a également annoncé jeudi le déploiement de nouvelles mesures de sécurité concernant l’utilisation de la santé mentale et la vérification de l’âge des adolescents, mais n’a pas consacré une grande partie du lancement à la présentation de ces changements.
Cet article a été mis à jour avec plus d’informations sur l’état d’efficacité de calcul d’OpenAI.
Vous avez une information sensible ou des documents confidentiels ? Nous rendons compte du fonctionnement interne de l’industrie de l’IA, des entreprises qui façonnent son avenir aux personnes touchées par leurs décisions. Contactez Rebecca Bellan à [email protected] ou Russell Brandom à [email protected]. Pour une communication sécurisée, vous pouvez les contacter via Signal à @rebeccabellan.491 et russellbrandom.49.

