La stabilité AI a publié un nouveau modèle d’IA, une caméra virtuelle stable, qui, selon la société, peut transformer des images 2D en vidéos «immersives» avec une profondeur et une perspective réalistes.
Les caméras virtuelles sont des outils souvent utilisés dans le cinéma numérique et l’animation 3D pour capturer et naviguer dans des scènes en temps réel. Avec une caméra virtuelle stable, la stabilité a cherché à ajouter une IA générative au mélange pour offrir un plus grand contrôle et une personnalisation, a déclaré la société dans un article de blog.
La caméra virtuelle stable génère des «vues nouvelles» d’une scène à partir d’une ou plusieurs images (jusqu’à 32 au total) à des angles de caméra qu’un utilisateur a spécifiquement à l’utilisateur. Le modèle peut générer des vidéos qui se déplacent le long des chemins de caméra ou des préréglages «dynamiques» comprenant «Spiral», «Dolly Zoom», «Move» et «Pan».

La version actuelle de la caméra virtuelle stable, un aperçu de la recherche, peut générer des vidéos dans les rapports carrés (1: 1), portrait (9:16) et paysage (16: 9) jusqu’à 1 000 images. La stabilité avertit que le modèle peut produire des résultats de qualité inférieure dans certains scénarios, en particulier avec des images mettant en vedette des humains, des animaux ou des «textures dynamiques» comme l’eau.
« Des scènes très ambiguës, des chemins de caméra complexes qui coupent des objets ou des surfaces et des objets de forme irrégulière peuvent provoquer des artefacts de flagerie », note la stabilité dans son article de blog, « en particulier lorsque les espèces cibles sont de manière différente des images d’entrée. »
Une caméra virtuelle stable est disponible pour une utilisation de la recherche sous une licence non commerciale. Il peut être téléchargé à partir du visage de la plate-forme AI Dev.
La stabilité, l’entreprise assiégée derrière le modèle populaire de génération d’images, la radiodiffusion stable, a recueilli de nouveaux espèces l’année dernière, les investisseurs comprenaient Eric Schmidt et le fondateur de Napster, Sean Parker, cherchait à changer l’entreprise. Emad Mostaque, co-fondateur et ex-PDG de Stabilité, aurait mal géré la stabilité dans la ruine financière, ce qui a conduit le personnel à démissionner, un partenariat avec Canva à passer et des investisseurs à se soucier des perspectives de l’entreprise.
Au cours des derniers mois, la stabilité a embauché un nouveau PDG, soutenant le réalisateur «Titanic» James Cameron à son conseil d’administration, et a publié plusieurs nouveaux modèles de génération d’images. Plus tôt en mars, la société s’est associée à Chipmaker ARM pour apporter un modèle d’IA qui peut générer un son, y compris le son sur les appareils mobiles, exécutant des puces ARM.