Demis Hassabis, PDG de l’organisation de recherche sur l’IA de Google Deepmind, a semblé suggérer mardi que Veo 3, le dernier modèle de génération vidéo de Google, pourrait être utilisé pour des jeux vidéo.
Responsable de publier sur X Beseeching Google pour «Laissez-moi jouer un jeu vidéo de mes vidéos Veo 3» et demandant «Playable World Models Wen?» Hassabis a répondu: « Maintenant, ce ne serait pas quelque chose. »
Mercredi matin, Logan Kilpatrick, produit principal pour le studio AI de Google et l’API Gemini, a sonné avec une réponse: «🤐🤐🤐🤐»
Les deux articles des dirigeants de Google ne sont guère plus que des suggestions ludiques, et un porte-parole de Google a déclaré à TechCrunch que la société n’avait rien à partager pour le moment. Mais la construction de modèles mondiaux jouables n’est pas en dehors du domaine des possibilités pour le géant de la technologie.
Les modèles mondiaux sont différents des modèles de génération vidéo. Le train simule la dynamique d’un environnement réel, qui permet aux agents de prédire comment le monde évoluera en réponse à leurs actions. Les modèles vidéo synthétisent des séquences vidéo réalistes.
Google prévoit de transformer son modèle de fondation multimodal, Gemini 2.5 Pro, en un modèle mondial qui simule les aspects du cerveau humain. En décembre, DeepMind a dévoilé Genie 2, un modèle qui peut générer une variété «sans fin» de mondes jouables. Le mois suivant, nous rapportons que Google formait une nouvelle équipe pour travailler sur des modèles d’IA qui peuvent simuler le monde réel.
D’autres travaillent sur la construction de modèles mondiaux, les plus notamment, le pionnier de l’IA Fei-Fei Li. Li est sorti de Stealth l’année dernière avec World Labs, une startup qui a construit son propre système AI A IA qui génère des scènes 3D de type jeu vidéo à partir d’une seule image.
Veo 3, qui est toujours en aperçu public, peut créer une vidéo ainsi que l’audio pour accompagner des clips – tout, de la parole aux bandes sonores. Bien que Veo 3 crée des mouvements réalistes en simulant la physique du monde réel, ce n’est pas encore tout à fait un modèle mondial. Au lieu de cela, il pourrait être utilisé pour la narration cinématographique dans les jeux, comme les cinématiques, les bandes-annonces et le prototypage narratif
Le modèle est également un modèle génératif de «sortie passive», et il (ou une future génération VEO) devrait se déplacer vers un simulateur plus actif, interactif et prédictif.
Mais le vrai défi avec la production de jeux vidéo n’est pas seulement des visuels impressionnants; C’est une simulation en temps réel, composé et contrôlable. C’est pourquoi il pourrait être logique de voir Google adopter une approche hybride qui tire parti de Veo et Genie à l’avenir, s’il poursuivait le jeu vidéo ou le développement mondial jouable.
Google pourrait se retrouver en concurrence avec Microsoft, Scénario, Runway, Pika et, vraiment, le modèle de génération vidéo d’Openai Sora.
Compte tenu des mouvements planifiés de Google dans l’espace des modèles mondiaux et de sa réputation d’utiliser ses poches profondes et ses muscles pour les rivaux à vapeur, les concurrents dans cet espace seraient sages de garder une surveillance étroite.