Le fondateur d’Ola, Bhavish Aggarwal, investit 230 millions de dollars dans un starttup d’IA qu’il a fondé alors que le pays pousse à s’établir dans un domaine dominé par les entreprises américaines et chinoises.
Aggarwal finance l’investissement dans Krutrim en grande partie par le biais de son bureau familial, a déclaré à TechCrunch, une source familière avec TechCrunch. Dans un article sur X mardi, Aggarwal a déclaré que Krutrim cherchait à attirer un investissement de 1,15 milliard de dollars d’ici l’année prochaine. Il cherchera à soulever le rappel de la capitale des investisseurs extérieurs, a indiqué la source.
L’annonce de financement coïncide avec la startup Unicorn Krutrim, ce qui fait ses modèles d’IA open source et le dévoilement des plans pour construire ce qu’il prétend être le grand supercomb de l’Inde en partenariat avec NVIDIA.
Le laboratoire a publié Krutrim-2, un modèle de langue de 12 milliards qui a montré de solides performances dans le traitement des langues indiennes. Dans les tests d’analyse de sentiment que Krutrim a partagé mardi, il a obtenu un score de 0,95 contre 0,70 pour les modèles concurrents, tout en atteignant un taux de réussite de 80% dans les tâches de génération de code.
Le laboratoire dispose de plusieurs modèles spécialisés, a inclus le système pour le traitement des images, la traduction de la parole et la recherche de texte, tous optimisés pour les langues indiennes.
«Nous sommes encore très proches des références mondiales, mais nous avons fait de bons progrès en un an», a écrit Aggarwal, dont les autres entreprises ont été soutenues par SoftBank, sur X. «En ouvrant Sourcing nos modèles, nous espérons que toute la communauté indienne de l’India collabore collabore Pour créer un écosystème d’IA indien de classe mondiale. «
L’initiative intervient alors que l’Inde cherche à s’établir dans un paysage d’intelligence artificielle dominée par les entreprises américaines et chinoises. La récente version du modèle «raisonnement» R1 de Deepseek, fondée sur un budget prétendument modeste, a envoyé un choc de choc dans l’industrie de la technologie.
L’Inde la semaine dernière a félicité les progrès de Deepseek et a déclaré que le pays accueillera les modèles de langue des grandes zones de l’IA chinois sur les serveurs nationaux. Le bras cloud de Krutrim a commencé à offrir Deepseek sur les serveurs indiens la semaine dernière.
Krutrim a également développé son cadre d’évaluation ou d’évaluation, Bharatbench, pour évaluer la maîtrise des modèles d’IA en langue indienne, combler une lacune dans les références existantes qui se concentrent principalement sur l’anglais et le chinois.
L’approche technique du laboratoire comprend l’utilisation d’une fenêtre de contexte de 128 000 tonnes, permettant à ses systèmes de gérer des textes plus longs et des conversations plus complexes. Les métriques de performance publiées par la startup ont montré que Krutrim-2 atteignait des scores élevés dans la correction de la grammaire (0,98) et les conversations multi-virages (0,91).
L’investissement fait suite au lancement de Krutrim-1 en janvier, un système de paramètres de 7 milliards de dollars qui a servi de modèle de langue maternelle de l’Inde. Le déploiement du supercalculateur avec NVIDIA devrait être mis en ligne en mars, avec une expansion prévue tout au long de l’année.