Google DeepMind a publié mardi un nouveau modèle de langue intitulé Gemini Robotics à disposition qui peut exécuter des tâches localement sur des robots sans nécessiter de connexion Internet.
S’appuyant sur le précédent modèle de robotique Gemini de l’entreprise qui a été publié en mars, Gemini Robotics sur les appareils peut contrôler les mouvements d’un robot. Les développeurs peuvent contrôler et affiner le modèle en fonction de divers besoins en langue uatral invite.
Dans les repères, Google affirme que le modèle fonctionne à un niveau proche du modèle robotique Gemini basé sur le cloud. La société affirme qu’elle surpasse les autres modèles à disque dans les références générales, bien qu’elle n’ait pas nommé ces modèles.

Dans une démo, l’entreprise a montré la course à pied de ce modèle local faisant des choses comme dézipper les sacs et les vêtements pliants. Google dit que même si le modèle a été formé pour les robots Aloha, il l’adapte plus tard pour travailler sur un robot Franka FR3 bi-bras et le robot Apollo Humanoid par Apptronik.
Google affirme que le Bi-Arm Franka FR3 a réussi à aborder des scénarios et des objets qu’il n’avait pas «vus» auparavant, comme faire de l’assemblage sur une ceinture industrielle.
Google Deepmind publie également un SDK robotique Gemini. La société a déclaré que les développeurs peuvent montrer des robots 50 à 100 démonstrations de tâches pour les former sur de nouvelles tâches en utilisant ces modèles sur le simulateur de physique Mujoco.
D’autres développeurs de modèles d’IA trempent également leurs orteils en robotique. Nvidia construit une plate-forme pour créer des modèles de fondation pour les humanoïdes; Les étreintes sont non seulement des modèles ouverts de développement et des ensembles de données pour la robotique, mais il travaille également sur les robots; Et la startup coréenne soutenue par Mirae Asset RLWRLD travaille sur la création de modèles fondamentaux pour les robots.