Jeudi, le PDG d’Open Eye, Sam Altman, a dévoilé le GPT-5 avec un soutien natif de 12 langues indiennes. L’année dernière, Google a élargi son support natif pour les neuf langues indiennes du modèle d’IA Gemini. L’Internet de la langue régionale émerge rapidement comme un énorme champ de bataille d’IA, alors que les startups d’intelligence artificielle se concentrent également sur l’humanité et la confusion aussi sur les langues indiennes. Mint explique pourquoi.
Pourquoi la langue est-elle importante pour les entreprises d’IA?
Le modèle d’IA de base est formé avec une grande quantité de données et génère des réponses avec du texte brut. Pour ce faire, les entreprises d’IA comptent sur des informations accessibles au public pour former leurs modèles. La plupart des informations sur Internet sont en anglais. En conséquence, tous les meilleurs modèles d’IA du monde sont natifs basés sur des données disponibles en anglais. Cela conduit à divers biais dans la façon dont les modèles d’IA comprennent les requêtes utilisateur, ce qui en fait un besoin fondamental pour les entreprises d’IA avec un accès linguistique plus large.
Pourquoi la langue indienne est-elle importante pour les entreprises d’IA?
L’hindi est la troisième langue parlée dans le monde ultérieur de l’anglais et du mandarin, selon la version ethnographique du référentiel linguistique mondial. Cumulativement, les 10 langues de l’Inde sont parlées par 1,7 milliard de personnes, soit 21% de la population mondiale (dont 1,5 milliard de conférenciers) et diverses versions des Chinois (1,4 milliard). Cela fait de l’Inde la plus grande région du monde que les entreprises technologiques peuvent utiliser.
Au-delà des chiffres, les experts soulignent que chaque langue a ses propres nuances, dialectes locaux, biais et complications. En raison de sa taille, les langues indiennes sont une ressource importante pour les modèles mondiaux d’IA.
Toutes les entreprises mondiales ciblent-elles l’Inde?
Oui. La semaine dernière, Sam Altman a déclaré que le dernier modèle d’Openai, le GPT-5, soutient nativement 12 langues indiennes. L’année dernière, Google a annoncé le support natif pour neuf langues indiennes. Meta a également déclaré l’année dernière que la famille Rama des modèles d’IA soutiendrait huit langues indiennes. Claude de l’humanité soutient l’hindi et le Bangla. Une autre startup de Silicon Valley proéminente, la perplexité prend en charge l’entrée et la sortie de l’hindi.
En Inde, Salvam a annoncé un modèle de discours d’IA à partir de textes formés dans 11 langues indiennes en mai. Le même mois, la startup vocale conversationnelle Gnani est devenue l’une des quatre startups choisies pour soutenir le gouvernement sous la mission indienne de l’IA. Nous avons annoncé notre intention de construire un modèle VOCY IA de 1,4 milliard de paramètres. Bharatgpt-Maker Corover et Soket construisent également des modèles d’IA formés nativement dans les langues locales.
Quelle est l’importance de l’Inde en matière de possibilités commerciales?
Ceci est difficile à évaluer. L’Inde est l’une des plus grandes bases d’utilisateurs au monde pour les sociétés d’IA. Cependant, en raison du comportement diversifié des consommateurs, ce marché est difficile à monétiser. En conséquence, la contribution de l’Inde aux revenus nets des sociétés mondiales de haute technologie variait de 1% à 4%.
Cependant, l’opinion est que la plupart des outils et plateformes d’IA nécessitent des abonnements de qualité d’entreprise pour tirer parti de l’IA, afin que les entreprises mondiales puissent progressivement ajouter la façon dont elles génèrent des revenus de l’Inde. La plupart des entreprises technologiques avec une énorme base d’utilisateurs s’attendent à ce que l’Inde devienne le principal centre de monétisation.
L’IA peut-elle voir des répliques de DPI pousser en Inde?
L’Inde tient à construire un modèle de base natif dans les langues indiennes grâce à un soutien gouvernemental. Les startups et les anciens combattants de l’industrie disent qu’à long terme, les modèles d’IA formés dans la plupart des langues indiennes peuvent être utilisés comme modèles pour d’autres modèles d’IA non anglais du monde entier.
Cela pourrait être similaire à la force motrice de l’Inde dans la fourniture d’infrastructures publiques numériques (DPI) au monde à long terme. D’autres pays ont également construit leurs propres modèles d’IA souverains, mais l’Inde estime qu’en fournissant des modèles d’IA au Sud mondial, l’Inde peut gagner du soft power.