OpenAI a dévoilé de nouvelles mises à jour API à sa journée de développement lundi, introduction GPT-5 Pro, son dernier modèle de langue, son nouveau modèle de génération de vidéos Sora 2 et un modèle vocal plus petit et moins cher.
Les mises à jour faisaient partie d’une série d’Announdations destinée à courtiser les développeurs de l’écosystème d’Openai, comprenaient le lancement d’un outil de construction d’agent et la possibilité de créer des applications dans Chatgpt.
L’ajout de GPT-5 PRO pourrait faire appel aux demandeurs de création de demandes de financement, juridique et de santé – qui ont besoin des industries «haute précision et profondeur de raisonnement», par Sam Altman, PDG d’Openai.
Altman a également noté que les capacités vocales seront essentielles à l’avenir car elle deviendra rapidement l’une des principales façons dont les gens utilisent pour interagir avec l’IA. À cette fin, OpenAI lance «GPT-Realtime Mini», un modèle vocal plus petit et moins cher dans l’API que les interactions de streaming à faible latence pour l’audio et la parole. Le nouveau modèle est à 70% moins cher que le modèle vocal avancé d’Openai, mais a promis la «même qualité et expressivité de la même voix.
Finlly, les créateurs impliqués dans l’écosystème du développeur d’OpenAI peuvent désormais puiser dans Sora 2 dans l’aperçu de l’API. OpenAI a publié Sora 2, son dernier générateur audio et vidéo, la semaine dernière aux côtés de l’application Sora, un concurrent Tiktok rempli de vidéos généreuses de courants AI. L’application Sora permet aux utilisateurs de générer des vidéos d’eux-mêmes, d’amis ou de tout ce qui est basé sur une invite, et de le partager via un flux algorithmique de style Tiktok.
« (Les développeurs) ont désormais accès au même modèle qui alimente les superbes sorties vidéo de Sora 2 directement dans votre propre application », a déclaré Altman.
Sora 2 s’appuie sur sa génération précédente avec des scènes plus réalistes et physiques avec un son synchronisé et un plus grand contrôle créatif – de la direction détaillée de la caméra aux visuels stylisés.
Événement TechCrunch
San Francisco
|
27-29 octobre 2025
« Par exemple, vous pouvez prendre la vue de l’iPhone et inciter Sora à l’étendre en un plan large et cinématatique », a déclaré Altman. « Mais l’une des choses les plus excitantes sur lesquelles nous travaillons est de savoir à quel point ce nouveau modèle sonne avec des visuels, pas seulement la parole, mais des paysages sonores riches, l’audio ambiant, des effets synchronisés qui sont des groupes dans ce que vous voyez. »
Sora 2 est présentée comme un outil pour le développement de concepts, où le point de départ visuel d’une annonce basée sur l’ambiance générale d’un produit, à un concepteur de Mattel transformant un croquis en un concept de jouets – un exemple Altman fourni à Dev Day qui met en lumière l’accord d’Opnai avec le Barbie Generative Ai dans le pipeline de fabrication de jouets.

