Il devient un peu plus facile de construire des projets de robotique sophistiqués à la maison.
Ai Dev Platform Hugging Face sorti plus tôt cette semaine un modèle d’IA ouvert pour la robotique appelée Smolvla. Formé sur des ensembles de données «sous licence de manière compatible», Smolvla surpasse les modèles beaucoup plus importants pour la robotique dans des environnements virtuels et réels, des affirmations de visage étreintes.
«Smolvla vise à démocratiser l’accès aux modèles de vision-action (VLA) et à accélérer la recherche envers les agents robotiques généralistes», écrit un visage étreint dans un article de blog. « Smolvla n’est pas seulement un modèle léger mais capable, mais aussi une méthode pour la formation et l’évaluation de la robotique généraliste (technologies). »
Smolvla fait partie de l’étreinte Stour en expansion rapide de Face pour établir un écosystème de matériel et de logiciels robotiques à faible coût. L’année dernière, la société a lancé Lerobot, une collection de modèles, de jeux de données et d’outils axés sur la robotique. Plus récemment, Hugging Face a acquis des pollen Robotics, une startup de robotique basée en France, et a dévoilé plusieurs systèmes de robotique bon marché, y compris les humanoïdes, à l’achat.
Smolvla, qui représente 450 millions de paramètres de taille, a été formé sur les données des ensembles de données de la communauté Lerobot, des ensembles de données de robotique spécialement marqués partagés sur la plate-forme de développement AI de l’IA de Face Face. Les paramètres, parfois rétractés aux poids, sont les composants internes d’un modèle qui guident son comportement.
Hugging Face affirme que Smolvla est suffisamment petit pour fonctionner sur un seul GPU de consommation – ou même un MacBook – et peut être testé et déployé sur du matériel «abordable», comprenait les propres systèmes de robotique de l’entreprise.
Dans une tournure intéressante, Smolvla prend également en charge une «pile d’inférence asynchrone», qui, selon le visage, permet au modèle de séparer le traitement des actions d’un robot à partir du traitement de ce qu’il voit et entend. Comme l’explique l’entreprise dans son article de blog: «(b) les équus de cette séparation, les robots peuvent réagir plus rapidement en changeant rapidement.»
Smolvla est disponible en téléchargement de Hugging Face. Déjà, un utilisateur sur X prétend avoir utilisé le modèle pour contrôler un bras robotique tiers:
Il convient de noter que le visage étreint est loin d’être le seul joueur de la course en robotique ouverte naissante.
NVIDIA a une collection d’outils pour la robotique ouverte, et les laboratoires de startup K-Spale créent les composants de ce qu’il appelle des «humanoïdes open source». Les entreprises de Fureapaid dans le segment comprenaient Dynation Robotics, l’intelligence physique soutenue par Jeff Bezos et RLWRLD.