OpenAI continue sur son chemin de guerre « code rouge » avec un nouveau modèle de génération d'images

OpenAI déploie une nouvelle version de ChatGPT Images qui promet un meilleur suivi des instructions, une édition plus précise et des vitesses de génération d’images jusqu’à 4 fois plus rapides.

Le nouveau modèle, baptisé GPT Image 1.5, est disponible à partir de mardi pour tous les utilisateurs de ChatGPT et via l’API. Il s’agit de la dernière escalade dans la concurrence avec Gemini de Google après que le PDG d’OpenAI, Sam Altman, a déclaré le mois dernier un « code rouge » dans une note interne divulguée. Le mémo détaille les plans d’OpenAI pour retrouver sa position de leader de l’IA après que Google ait commencé à prendre des parts de marché suite à la sortie de Gemini 3, son dernier modèle phare, et de Nano Banana Pro, la dernière version du générateur d’images virales de Google – qui ont tous deux dominé le classement LMArena sur plusieurs points de référence.

Google maintient son avance même après qu’OpenAI ait répondu à son succès la semaine dernière avec le lancement de GPT-5.2, le présentant comme son modèle le plus avancé à ce jour pour les développeurs et pour un usage professionnel quotidien. OpenAI aurait prévu de publier un nouveau générateur d’images début janvier, accélérant ces plans avec l’annonce de cette semaine. Sa dernière version de modèle d’image était GPT Image 1 en avril.

GPT Image 1.5 arrive à mesure que les générateurs d’images et de vidéos progressent au-delà des prototypes et acquièrent davantage de capacités prêtes pour la production. Comme Nano Banana Pro, ChatGPT Image offre des fonctionnalités de post-production, fournissant des contrôles d’édition plus granulaires pour maintenir la cohérence visuelle, comme la ressemblance du visage, l’éclairage, la composition et la tonalité des couleurs lors des modifications.

La même image représentée ci-dessus avec différentes modifications pour mettre en valeur le suivi amélioré des instructions de GPT Image 1.5.Crédits image : OpenAI

La plupart des outils d’image GenAI sont mauvais en itération, ce serait donc un énorme pas en avant. Lorsqu’on leur demande un changement spécifique, comme « ajuster l’expression du visage » ou « rendre l’éclairage plus froid », les modèles réinterprètent souvent l’intégralité de l’image, entraînant un manque de cohérence.

La mise à jour ne concerne pas seulement les nouvelles fonctionnalités. Les images ChatGPT seront également désormais accessibles via un point d’entrée dédié dans la barre latérale ChatGPT qui fonctionne « plus comme un studio de création », a écrit Fidji Simo, PDG des applications d’OpenAI, dans un article de blog mardi.

« Les nouveaux écrans de visualisation et d’édition d’images facilitent la création d’images qui correspondent à votre vision ou vous inspirent des invites de tendances et des filtres prédéfinis », a écrit Simo.

Événement Techcrunch

San Francisco
|
13-15 octobre 2026

En plus du nouveau générateur d’images, OpenAI introduit de nouvelles façons d’améliorer l’expérience ChatGPT avec davantage d’éléments visuels. Le plan est de faire en sorte que les requêtes de recherche affichent davantage de visuels avec des sources claires, ce qui pourrait être utile pour des tâches telles que la conversion de mesures ou la vérification des résultats sportifs, selon Simo.

« Lorsque vous créez, vous devriez être capable de voir et de façonner ce que vous créez. Lorsque les visuels racontent une histoire mieux que les mots seuls, ChatGPT devrait les inclure », a écrit Simo. « Lorsque vous avez besoin d’une réponse rapide ou que l’étape suivante se trouve dans un autre outil, elle devrait être là. Ce faisant, nous pouvons continuer à réduire la distance entre ce que vous avez en tête et votre capacité à lui donner vie. «

Source link

What's Hot

Les États-Unis et l’Iran échangent de nouvelles frappes dans le détroit d’Ormuz alors que l’Iran cherche à fermer la route concurrente

2 milliards d’exemplaires imprimés, un dernier hourra pour une légende de la Coupe du monde dans un pack à 2 $ : The Last Ride of the Panini Sticker Album

Apple demande l’approbation des États-Unis pour acheter des puces CXMT sur liste noire : FT

OpenAI continue sur son chemin de guerre « code rouge » avec un nouveau modèle de génération d’images

Le fondateur le plus en forme de la salle a eu un cancer. Voici comment il a utilisé l’IA pour riposter.

Des startups asiatiques d’IA lancent des modèles de type Mythos alors que l’interdiction d’exporter d’Anthropic se prolonge

Trump Admin publie Anthropic Mythos qui sera utilisé par plus de 100 entreprises et agences américaines

La FTC donne à Musk l’autorisation d’acquérir Mesh, une ancienne startup de SpaceX

Quelles actions fintech sont les meilleures à acheter en 2026 ?

Quelles actions fintech sont les meilleures à acheter en 2026 ?

A Third Of Fintech Is Invisible To AI Agents

Top Insights

Les États-Unis et l’Iran échangent de nouvelles frappes dans le détroit d’Ormuz alors que l’Iran cherche à fermer la route concurrente

2 milliards d’exemplaires imprimés, un dernier hourra pour une légende de la Coupe du monde dans un pack à 2 $ : The Last Ride of the Panini Sticker Album

Apple demande l’approbation des États-Unis pour acheter des puces CXMT sur liste noire : FT

What's Hot

OpenAI continue sur son chemin de guerre « code rouge » avec un nouveau modèle de génération d’images

Related Posts

Subscribe to Updates