Cette semaine, Google a publié une famille de modèles d’IA ouverts, Gemma 3, qui ont rapidement fait l’éloge de leur efficacité impressionnante. Mais comme un certain nombre de développeurs se sont loncés sur X, la licence de Gemma 3 fait de l’utilisation commerciale des modèles une proposition risquée.
Ce n’est pas un problème unique à Gemma 3. Des sociétés comme Meta appliquent également des termes de licence personnalisés et non standard à leurs modèles ouvertement avaïbles, et les termes présentent des défis juridiques pour les entreprises. Certaines entreprises, en particulier les opérations plus petites, craignent que Google et d’autres puissent «tirer le tapis» sur leur entreprise en affirmant les clauses les plus onéreuses.
«La licence restrictive et incohérente des modèles dits« ouverts »crée une incertitude, en particulier pour l’adoption commerciale», a déclaré Nick Vidal, responsable de la communauté à l’initiative open source, a déclaré à TechCrunch de longue date. «Bien que ces modèles soient commercialisés comme ouverts, les termes réels impose divers obstacles juridiques et pratiques qui dissuadent les entreprises de les intégrer dans leurs produits ou services.»
Les développeurs de modèles ouverts ont leurs raisons pour les modèles de reres de rerescule sous des licences propulsaires par opposition aux options standard de l’industrie comme Apache et MIT. La startup de l’IA Cohere, par exemple, a été claire sur son intention de soutenir le travail scientifique – mais pas commercial – en plus de ses modèles.
Mais les licences LLAMA de Gemma et Meta en particulier ont des restrictions qui limitent la façon dont les entreprises peuvent utiliser les modèles sans crainte de réimpressions légales.
Meta, par exemple, interdit aux développeurs d’utiliser la «sortie ou les résultats» des modèles LLAMA 3 pour améliorer n’importe quel modèle en plus de LLAMA 3 ou «œuvres dérivées». Il fait également des entreprises avec plus de 700 millions d’utilisateurs actifs mensuels de déploier des modèles LLAMA sans d’abord une licence spéciale supplémentaire.
La licence de Gemma est généralement moins bardensome. Mais cela accorde à Google le droit de «restreindre (remotalie ou autrement) de Gemma qui, selon Google, est en violation de la politique d’utilisation interdite de la société ou des« lois et réglementations applicables ».
Ces termes donnent simplement des applications aux modèles originaux de lama et de Gemma. Les modèles basés sur Llama ou Gemma doivent également adhérer aux licences Llama et Gemma, respectivement. Dans le cas de Gemma, qui comprenait des modèles formés sur les données synthétiques générées par Gemma.
Florian Brand, assistante de recherche au Centre de recherche allemand pour l’intelligence artificielle, estime que – malgré ce que l’exercice géant de la technologie vous ferait croire – comme le gamma et le LLAMA «ne peuvent raisonnablement être appelés` `open source» ».
« La plupart des entreprises ont un ensemble de licences approuvées, telles qu’Apache 2.0, de sorte que n’importe quel Locse personnalisé est beaucoup de tirage et d’argent », a déclaré Brand à TechCrunch. «Les petites entreprises sans équipes juridiques ou l’argent pour les avocats s’en tiendront à des modèles avec des licences standard.»
La marque a fait la nade que les développeurs de modèles d’IA avec des licences personnalisées, comme Google, n’ont pas encore appliqué agressivement leurs conditions. Cependant, la menace est souvent suffisante pour dissuader l’adoption, a-t-il ajouté.
« Ces restrictions ont un impact sur l’écosystème de l’IA – même sur des chercheurs comme moi », a déclaré Brand.
Han-Chung Lee, directeur de l’apprentissage automatique chez Moody’s, convient que les licences personnalisées telles que celles attachées à Gemma et Llama rendent les modèles «non utilisables» dans de nombreux scénarios commerciaux. Donc, Desric Tramel, un personnel a appliqué un scientifique à la startup de l’IA Gretel.
«Les licences spécifiques au modèle rendent des courses spécifiques pour les dérivés du modèle et la distillation, ce qui cause des inquiétudes concernant les affreins», a déclaré Tramel. «Imaginez une entreprise qui produit spécifiquement des modèles de réglages pour leurs clients. Quelle licence un Gemma-Data a-t-il été affiné de lama? Quel serait l’impact pour tous leurs clients en aval? «
Le scénario qui déploie la plupart de la peur, a déclaré Tramel, est que les modèles sont un cheval de Troie de sorts.
« Une fonderie modèle peut éteindre les modèles (ouverts), attendre de voir quels analyses de rentabilisation de ces modèles, puis se frayer un chemin dans les verticales réussies par l’extorsion ou la loi », a-t-il déclaré. «Par exemple, Gemma 3, par toutes les apparences, semble être une libération solide – et qui pourrait avoir un impact large. Mais le marché peut l’adopter en raison de sa structure de licence. Ainsi, les entreprises resteront probablement avec des modèles APACHE 2.0 peut-être plus faibles et moins fiables. «
Pour être clair, certains modèles ont gardé une répartition généralisée à l’esprit de leurs licences restrictives. Llama, par exemple, a été téléchargé des centaines de fois et intégré à des produits de grandes sociétés, comprenait Spotify.
Mais ils pourraient avoir encore plus de succès s’ils étaient permis de permettre, selon Yacine Jernite, responsable de l’apprentissage automatique et de la société à la startup de l’IA étreignant le visage. Jernite a appelé des fournisseurs comme Google à passer à des cadres de licence ou à ouvrir des cadres de licence et à «collaborer plus directement» avec les utilisateurs à accepter largement les termes.
« Compte tenu du manque de consensus sur ces termes et du fait que bon nombre des assèges sous-jacents ont encore été testés devant les tribunaux, tout sert principalement de déclaration d’intention de ces acteurs », a déclaré Jernite. « (Mais si certaines clauses) sont interprétées trop largement pour construire des produits commerciaux réussis.
Vidal a déclaré qu’il y avait un besoin urgent de sociétés de modèles d’IA qui peuvent librement intégrer, modifier et partager sans craindre des changements de licence soudains ou une ambiguïté légale.
« Le paysage actuel des licences de modèle d’IA est criblé de confusion, de termes restrictifs et de réclamations trompeuses d’ouverture », a déclaré Vidal. «Au lieu de redéfinir« ouvert »pour suivre les intérêts des entreprises, l’industrie de l’IA devrait s’aligner sur les principes open source établis pour créer un écosystème vraiment ouvert.»

