OpenAI déploie une nouvelle version de ChatGPT Images qui promet un meilleur suivi des instructions, une édition plus précise et des vitesses de génération d’images jusqu’à 4 fois plus rapides.
Le nouveau modèle, baptisé GPT Image 1.5, est disponible à partir de mardi pour tous les utilisateurs de ChatGPT et via l’API. Il s’agit de la dernière escalade dans la concurrence avec Gemini de Google après que le PDG d’OpenAI, Sam Altman, a déclaré le mois dernier un « code rouge » dans une note interne divulguée. Le mémo détaille les plans d’OpenAI pour retrouver sa position de leader de l’IA après que Google ait commencé à prendre des parts de marché suite à la sortie de Gemini 3, son dernier modèle phare, et de Nano Banana Pro, la dernière version du générateur d’images virales de Google – qui ont tous deux dominé le classement LMArena sur plusieurs points de référence.
Google maintient son avance même après qu’OpenAI ait répondu à son succès la semaine dernière avec le lancement de GPT-5.2, le présentant comme son modèle le plus avancé à ce jour pour les développeurs et pour un usage professionnel quotidien. OpenAI aurait prévu de publier un nouveau générateur d’images début janvier, accélérant ces plans avec l’annonce de cette semaine. Sa dernière version de modèle d’image était GPT Image 1 en avril.
GPT Image 1.5 arrive à mesure que les générateurs d’images et de vidéos progressent au-delà des prototypes et acquièrent davantage de capacités prêtes pour la production. Comme Nano Banana Pro, ChatGPT Image offre des fonctionnalités de post-production, fournissant des contrôles d’édition plus granulaires pour maintenir la cohérence visuelle, comme la ressemblance du visage, l’éclairage, la composition et la tonalité des couleurs lors des modifications.

La plupart des outils d’image GenAI sont mauvais en itération, ce serait donc un énorme pas en avant. Lorsqu’on leur demande un changement spécifique, comme « ajuster l’expression du visage » ou « rendre l’éclairage plus froid », les modèles réinterprètent souvent l’intégralité de l’image, entraînant un manque de cohérence.
La mise à jour ne concerne pas seulement les nouvelles fonctionnalités. Les images ChatGPT seront également désormais accessibles via un point d’entrée dédié dans la barre latérale ChatGPT qui fonctionne « plus comme un studio de création », a écrit Fidji Simo, PDG des applications d’OpenAI, dans un article de blog mardi.
« Les nouveaux écrans de visualisation et d’édition d’images facilitent la création d’images qui correspondent à votre vision ou vous inspirent des invites de tendances et des filtres prédéfinis », a écrit Simo.
Événement Techcrunch
San Francisco
|
13-15 octobre 2026
En plus du nouveau générateur d’images, OpenAI introduit de nouvelles façons d’améliorer l’expérience ChatGPT avec davantage d’éléments visuels. Le plan est de faire en sorte que les requêtes de recherche affichent davantage de visuels avec des sources claires, ce qui pourrait être utile pour des tâches telles que la conversion de mesures ou la vérification des résultats sportifs, selon Simo.
« Lorsque vous créez, vous devriez être capable de voir et de façonner ce que vous créez. Lorsque les visuels racontent une histoire mieux que les mots seuls, ChatGPT devrait les inclure », a écrit Simo. « Lorsque vous avez besoin d’une réponse rapide ou que l’étape suivante se trouve dans un autre outil, elle devrait être là. Ce faisant, nous pouvons continuer à réduire la distance entre ce que vous avez en tête et votre capacité à lui donner vie. «

