La course à la publication de modèles mondiaux est lancée alors que la société de génération d’images et de vidéos IA Runway rejoint un nombre croissant de startups et d’entreprises Big Tech en lançant son premier. Baptisé GWM-1, le modèle fonctionne par prédiction image par image, créant une simulation avec une compréhension de la physique et du comportement réel du monde au fil du temps, a indiqué la société.
Un modèle mondial est un système d’IA qui apprend une simulation interne du fonctionnement du monde afin de pouvoir raisonner, planifier et agir sans avoir besoin d’être formé sur tous les scénarios possibles dans la vie réelle.
Runway, qui a lancé plus tôt ce mois-ci son modèle vidéo Gen 4.5 qui a surpassé Google et OpenAI dans le classement Video Arena, a déclaré que son modèle mondial GWM-1 est plus « général » que le Genie-3 de Google et d’autres concurrents. L’entreprise le présente comme un modèle capable de créer des simulations pour former des agents dans différents domaines comme la robotique et les sciences de la vie.
« Pour construire un modèle mondial, nous devions d’abord créer un modèle vidéo vraiment génial. Nous pensons que la bonne voie pour construire un modèle mondial est d’apprendre aux modèles à prédire directement les pixels, c’est le meilleur moyen de réaliser une simulation à usage général. À une échelle suffisante et avec les bonnes données, vous pouvez construire un modèle qui comprend suffisamment le fonctionnement du monde », a déclaré le directeur technique de la société, Anastasis Germanidis, lors de la diffusion en direct.
Runway a publié des inclinaisons ou des versions spécifiques du nouveau modèle mondial appelé GWM-Worlds, GWM-Robotics et GWM-Avatars.

GWM-Worlds est une application pour le modèle qui vous permet de créer un projet interactif. Les utilisateurs peuvent définir une scène via une invite ou une référence d’image, et à mesure que vous explorez l’espace, le modèle génère le monde avec une compréhension de la géométrie, de la physique et de l’éclairage. La société a mentionné que la simulation fonctionne à 24 ips et à une résolution de 720p. Runway a déclaré que même si Worlds pouvait être utile pour les jeux, il était également bien placé pour enseigner aux agents comment naviguer et se comporter dans le monde physique.
Avec GWM-Robotics, l’entreprise vise à utiliser des données synthétiques enrichies de nouveaux paramètres comme des conditions météorologiques changeantes ou des obstacles. Runway affirme que cette méthode pourrait également révéler quand et comment les robots pourraient enfreindre les politiques et les instructions dans différents scénarios.
Événement Techcrunch
San Francisco
|
13-15 octobre 2026
Runway construit également des avatars réalistes sous GWM-Avatars pour simuler le comportement humain. Des entreprises comme D-ID, Synthesia, Soul Machines et même Google ont travaillé à la création d’avatars humains qui semblent réels et fonctionnent dans des domaines tels que la communication et la formation.
La société a noté que techniquement, les mondes, la robotique et les avatars sont des modèles distincts, mais elle prévoit à terme de les fusionner en un seul modèle.
En lançant un nouveau modèle mondial, la société met également à jour son modèle fondamental Gen 4.5 publié plus tôt dans le mois. La nouvelle mise à jour apporte au modèle des capacités audio natives et de génération multi-prises de longue durée. La société a déclaré qu’avec ce modèle, les utilisateurs peuvent générer des vidéos d’une minute avec une cohérence des personnages, un dialogue natif, un arrière-plan audio et des plans complexes sous différents angles. La société a déclaré que vous pouvez également modifier l’audio existant et ajouter des dialogues. De plus, vous pouvez éditer des vidéos multi-prises de n’importe quelle longueur.
La mise à jour Gen 4.5 rapproche Runway de la suite vidéo tout-en-un du concurrent Kling, qui a également été lancée plus tôt ce mois-ci, notamment autour de l’audio natif et de la narration multi-plans. Cela indique également que les modèles de génération vidéo passent du prototype aux outils prêts pour la production. Le modèle Gen 4.5 mis à jour de Runway est disponible pour tous les utilisateurs de forfaits payants.

La société a annoncé qu’elle rendrait GWM-Robotics disponible via un SDK. Il a ajouté qu’il était en conversation active avec plusieurs entreprises et sociétés de robotique pour l’utilisation de GWM-Robotics et GWM-Avatars.

