Du 4O d’OpenAI à la diffusion stable, les modèles de fondation AI qui créent des images réalistes à partir d’une invite de texte sont la nuit. En revanche, les modèles de fondation capables de générer des légers en ligne 3D complets et cohérents à partir d’une invite de texte ne font que d’émerger.
Pourtant, ce n’est qu’une question de savoir quand, pas si, ces modèles seront facilement disponibles. Maintenant, l’un des chercheurs de modèle AI 3D les plus importants d’Europe, Matthias Niessner, a pris un congé entrepreneurial de son information visuelle et un laboratoire à l’Université technique de Munich pour fonder une startup travaillant dans la région: l’espaitiel.
Formulaire cofondateur à Synthesia, la startup réaliste de l’avatar AI d’une valeur de 2,1 milliards de dollars, Niessner a levé une série de semences inhabituellement importante pour une startup européenne de 13 millions de dollars. Le tour a été dirigé par Earlybird Capital Capital, un investisseur européen de premier stade (Backers of UIPATH, PeakGames par exemple) avec la participation de SpeedInvest et de plusieurs anges de haut niveau.
Cette taille ronde est encore plus impressionnante lorsque l’on tient compte du fait que Spaitial n’a pas encore grand-chose à montrer au monde autre qu’une vidéo teaser récemment publiée montrant comment une invite de texte pourrait générer une salle 3D.
Mais ensuite, il y a l’équipe technique que Niessner a rassemblé: Ricardo Martin-Brualla, qui auparavant dans le monde sur la plate-forme de téléconférence 3D de Google, maintenant appelé Beam; Et David Novotny, qui a passé six ans à Meta où a dirigé le projet de génération d’actifs 3D de l’entreprise.
Leur expertise collective leur donnera une chance de combattre dans un espace qui inclut déjà certains concurrents en mettant un accent similaire sur le photoréalisme. Il y a Odyssey, qui a levé 27 millions de dollars et va après les cas d’utilisation du divertissement. Mais il y a aussi World Labs, la startup fondée par le pionnier de l’AI Fei-Fei Li, et déjà évaluée à plus d’un milliard de dollars.
Niessner pense que c’est encore peu de concurrence par rapport à ce qui est pour les autres types de modèles de fondation, mais aussi en regardant «la plus grande vision» que lui et d’autres poursuivent.
« Je ne veux pas seulement avoir un monde 3D. Je veux aussi que ce monde se comporte comme le monde réel. Je veux que ce soit interactable et (laissez) faire des choses dedans, et personne n’a vraiment craqué », a-t-il déclaré.

Jeux vidéo dans le monde réel
Personne n’a encore vraiment craqué quelle pourrait être la demande d’environnement 3D photoréaliste, eith. La promesse d’une opportunité de « milliard de dollars » allant des jumeaux numériques à la réalité augmentée semble assez grande pour exciter les VC, mais il est également vague et multiforme suffisamment pour rendre la stratégie de mise sur le marché difficile à comprendre. Le cas d’utilisation le plus évident est pour la création de jeux vidéo, mais ces modèles pourraient également avoir des applications dans le divertissement, des visualisations 3D utilisées dans la construction, et cette utilisation dans le monde réel pour des domaines comme l’entraînement robotique.
Niessner espère contourner ce problème en demandant aux développeurs de concéder au modèle de fondation pour proposer des applications DownStream pour une utilisation spécifique. Il a également animé un quatrième cofondateur, le directeur de Cazoo, Luke Rogers, une fois son colocataire à Palo Alto alors qu’il était professeur adjoint invité à Stanford, pour l’aider du côté commercial.
L’une des premières tâches de la feuille de route de Spaitial sera d’identifier des partenaires qui peuvent fonctionner avec des modèles antérieurs, par rapport à ceux qui devraient attendre une meilleure qualité.
« Nous voulons au moins travailler avec quelques partenaires », a déclaré Niessner, « et voyez comment ils peuvent utiliser les API. »
Par rapport à d’autres startups de l’IA bien-ul-ul, Spaitial augmente les revenus plus élevés à son programme. Mais d’abord, il devra en dépenser, à la fois en calcul et en embauchant. Pour le plus tard, il se concentre sur la qualité, pas sur la quantité. Selon Niessner, «l’équipe n’est pas du fléau de se forger à la pendaison des gens; cela ne se produit tout simplement pas, et nous faisons votre besoin.»
Au lieu de cela, Niessner et ses cofondateurs travaillent à générer des espaces 3D plus grands et plus interactifs, où, par exemple, un verre peut se briser de manière réaliste. Cela débloquerait ce que Niessner fait référence au «Saint Graal»: qu’un type de crème de 10 ans dans un texte et fait leur propre jeu vidéo en 10 minutes.
À son avis, cet objectif ambitieux est en fait plus réalisable que ce qui pourrait sembler que les utilisateurs de fruits à faible maintien créent des objets 3D la plupart des plateformes de jeu contrôlent toujours étroitement ce que les troisième parties peuvent ajouter. C’est-à-dire de la race, à moins qu’ils ne décident de le construire eux-mêmes, comme Roblox le pourrait. Mais à ce moment-là, l’espaitiel pourrait être occupé à remplacer CAD à la place; Le chapitre suivant de la génération 3D ne fait que commencer.