La famille de modèles d’IA «ouverte» de Google, Gemma, se développe.
Au cours de Google I / O 2025 WE mardi, Google a pris les wraps Gemma 3n, un modèle conçu pour fonctionner «en douceur» sur les téléphones, les ordinateurs portables et les tablettes. Disponible en avant-première à partir de mardi, Gemma 3n peut gérer l’audio, le texte, les images et les vidéos, selon Google.
Les modèles suffisamment efficaces pour s’exécuter hors ligne et sans avoir besoin de calcul dans le cloud ont acquis de la vapeur dans la communauté de l’IA ces dernières années. Non seulement ils sont moins chers à utiliser que les grands modèles, mais ils préservent la confidentialité en éliminant la nécessité de transférer des données dans un centre de données distant.
Lors d’un discours d’E / S, le chef de produit Gemma, Gus Martins, a déclaré que Gemma 3n peut fonctionner sur des appareils avec moins de 2 Go de RAM. « Gemma 3n partage la même architecture que Gemini Nano, et est et est et est généré pour des performances incroyables », a-t-il ajouté.
En plus de Gemma 3n, Google publie Medgemma par le biais de son programme de fondations pour les développeurs d’IA Health. Selon la société, Medgemma est son modèle ouvert le plus compétent pour une analyse du texte et des images liés à la santé.
« Medgemma (est) notre (…) collection de modèles ouverts pour la compréhension du texte et de l’image multimodal (santé) », a déclaré Martins. «Medgemma fonctionne très bien dans une gamme d’applications d’image et de texte, afin que les développeurs (…) puissent adapter les modèles pour leurs applications de santé.»
Signgemma, un modèle ouvert pour traduire la langue des signes, est également à l’horizon, un modèle ouvert pour traduire la langue des signes en texte parlé. Google dit que SignGemma permettra aux développeurs de créer de nouvelles applications et intégrations pour les utilisateurs sourds et malentendants.
« Signgemma est une nouvelle famille de modèles formés pour traduire la langue des signes en texte parlé, mais c’est le meilleur dans la langue des signes américaine et l’anglais », a déclaré Martins. «C’est le modèle de compréhension de la langue des signes le plus capable de tous les temps, et nous avons hâte que vos développeurs et les communautés sourdes et malentendantes prennent ce fondement et construisent avec.»
Il convient de noter que Gemma a été critiqué pour ses termes de licence de douane et non standard, qui, selon certains développeurs, ont fait en utilisant les modèles commercialement une proposition risquée. Cela a dissuadé que les développeurs de télécharger collectivement des modèles GEMMA sont des dizaines de fois.
Mise à jour de 14h40 Pacifique: Ajout de plusieurs trimestres du Gemma Product Manager Gus Martins.