La société d’IA d’entreprise Cohere a lancé une nouvelle famille de modèles multilingues en marge du sommet indien sur l’IA en cours. Les modèles, surnommés Tiny Aya, sont ouverts – ce qui signifie que leur code sous-jacent est accessible au public pour que quiconque puisse l’utiliser et le modifier – prend en charge plus de 70 langues et peut fonctionner sur des appareils quotidiens comme des ordinateurs portables sans nécessiter de connexion Internet.
Le modèle, lancé par la branche de recherche de la société, Cohere Labs, prend en charge les langues sud-asiatiques telles que le bengali, l’hindi, le punjabi, l’ourdou, le gujarati, le tamoul, le telugu et le marathi.
Le modèle de base contient 3,35 milliards de paramètres, une mesure de sa taille et de sa complexité. Cohere a également lancé TinyAya-Global, une version affinée pour mieux suivre les commandes de l’utilisateur, pour les applications nécessitant une large prise en charge linguistique. Des variantes régionales complètent la famille : TinyAya-Earth pour les langues africaines ; TinyAya-Fire pour les langues sud-asiatiques ; et TinyAya-Water pour l’Asie-Pacifique, l’Asie occidentale et l’Europe.

« Cette approche permet à chaque modèle de développer des bases linguistiques et des nuances culturelles plus solides, créant ainsi des systèmes qui semblent plus naturels et plus fiables pour les communautés qu’ils sont censés servir. Dans le même temps, tous les modèles Tiny Aya conservent une large couverture multilingue, ce qui en fait des points de départ flexibles pour une adaptation et des recherches ultérieures », a déclaré la société dans un communiqué.
Cohere a noté que ces modèles, qui ont été formés sur un seul cluster de 64 GPU H100 (un type de puce haute puissance de Nvidia) utilisant des sources informatiques relativement modestes, sont idéaux pour les chercheurs et les développeurs qui créent des applications pour un public parlant des langues maternelles. Les modèles sont capables de s’exécuter directement sur les appareils, afin que les développeurs puissent les utiliser pour effectuer des traductions hors ligne. La société a indiqué qu’elle avait conçu son logiciel sous-jacent pour s’adapter à une utilisation sur l’appareil, nécessitant moins de puissance de calcul que la plupart des modèles comparables.

Dans des pays linguistiquement diversifiés comme l’Inde, ce type de fonctionnalité hors ligne peut ouvrir un ensemble diversifié d’applications et de cas d’utilisation sans avoir besoin d’un accès constant à Internet.
Les modèles sont disponibles sur HuggingFace, la plateforme populaire de partage et de test de modèles d’IA, et sur la plateforme Cohere. Les développeurs peuvent les télécharger sur HuggingFace, Kaggle et Ollama pour un déploiement local. La société publie également des ensembles de données de formation et d’évaluation sur HuggingFace et prévoit de publier un rapport technique détaillant sa méthodologie de formation.
Événement Techcrunch
Boston, Massachusetts
|
23 juin 2026
Le PDG de la startup, Aidan Gomez, a déclaré l’année dernière que la société prévoyait d’entrer en bourse « bientôt ». Selon CNBC, la société a terminé 2025 sur une bonne note, enregistrant 240 millions de dollars de revenus annuels récurrents, avec une croissance de 50 % d’un trimestre à l’autre tout au long de l’année.

