
L’analyse récente de HSBC sur les défis financiers auxquels OpenAI est confrontée montre l’ampleur de la réflexion de l’entreprise. Il prétend déjà avoir 20 milliards de dollars de revenus. L’entreprise dépense 1,4 billion de dollars pour construire de nouveaux centres de données qui alimenteront l’interface ChatGPT. Même si elle pouvait générer plus de 200 milliards de dollars de revenus d’ici 2030, elle aurait besoin de 207 milliards de dollars supplémentaires pour survivre.
Ils sont énormes.
Mais plus d’une douzaine de spécialistes de l’IA qui se sont entretenus avec Fortune lors du récent Web Summit à Lisbonne ont parlé d’un avenir différent pour l’IA. Cet avenir, disent-ils, sera caractérisé par des opérations d’IA plus petites qui tournent autour d’« agents » d’IA qui effectuent des tâches spécialisées et de niche. Il n’est donc pas nécessaire d’avoir recours aux modèles de langage géants à grande échelle qui alimentent OpenAI, Gemini de Google ou Claude d’Anthropic.
« Leur évaluation est basée sur l’idée que plus c’est gros, mieux c’est, mais ce n’est pas nécessairement le cas », a déclaré Babak Hodjat, responsable de l’IA de Cognizant, à Fortune.
« Nous utilisons de grands modèles de langage. Nous n’avons pas besoin des plus grands. Il y a un seuil avant qu’un grand modèle de langage puisse suivre des instructions dans un domaine limité et communiquer réellement avec d’autres agents à l’aide d’outils », a-t-il déclaré. « Si vous êtes au-dessus de ce seuil, cela suffit. »
Par exemple, lorsque Deep Seek a introduit en janvier dernier un nouveau modèle dont le développement n’aurait coûté que quelques millions de dollars, cela a provoqué une liquidation des valeurs technologiques. Il utilisait également moins de paramètres par requête et fonctionnait sur un modèle beaucoup plus petit que ChatGPT d’OpenAI, mais avait des fonctionnalités comparables, a déclaré Hodjat. En dessous d’une certaine taille, certains modèles ne nécessitent pas de centre de données et peuvent fonctionner sur un MacBook, a-t-il précisé. « C’est la différence, c’est la tendance », a-t-il déclaré.
De nombreuses entreprises orientent leurs services autour d’agents ou d’applications d’IA, en supposant que les utilisateurs souhaitent que des applications spécifiques fassent des choses spécifiques. Selon le PDG Shishir Mehrotra, Superhuman (anciennement Grammarly) exploite une boutique d’applications remplie « d’agents IA qui peuvent résider dans votre navigateur ou dans l’une des milliers d’applications que Grammarly est déjà autorisée à exécuter ».
Chez Mozilla, la PDG Laura Chambers a une stratégie similaire pour le navigateur Firefox. « Nous disposons de certaines fonctionnalités d’IA telles que la fonctionnalité ‘Secouer pour résumer’, le regroupement d’onglets intelligents mobiles, les aperçus de liens, les traductions, le tout utilisant l’IA. Tout ce que nous faisons avec cela est fait localement, donc aucune donnée ne quitte l’appareil. Elle n’est pas partagée avec le modèle. Elle n’est pas partagée avec LLM. Il y a aussi un petit curseur où vous pouvez sélectionner votre propre modèle avec lequel vous souhaitez travailler et utiliser l’IA de cette manière », a-t-elle déclaré.
Ami Badani, responsable de la stratégie et directeur marketing du fabricant de puces ARM, a déclaré à Fortune que la société était indépendante des modèles. « Ce que nous faisons, c’est créer des extensions personnalisées au-dessus de LLM pour des cas d’utilisation très spécifiques, car évidemment ces cas d’utilisation sont très différents d’une entreprise à l’autre », a-t-elle déclaré.
Cette approche, dans laquelle des agents d’IA hautement ciblés fonctionnent comme n’importe quelle autre entreprise, contraste avec les grandes plateformes d’IA à usage général. À l’avenir, une source a demandé à Fortune, utiliseriez-vous ChatGPT pour réserver une chambre d’hôtel qui correspond à vos besoins spécifiques (comme vouloir une chambre avec une baignoire au lieu d’une douche, ou une vue orientée à l’ouest), ou utiliseriez-vous un agent spécialisé avec une base de données d’un kilomètre de profondeur contenant uniquement des données d’hôtel ?
Cette approche a attiré d’importants fonds d’investissement. IBM Ventures, un fonds de capital-risque axé sur l’IA de 500 millions de dollars, investit dans des efforts d’IA résolument peu glamour qui remplissent des niches d’entreprise obscures. L’un de ces investissements est une société nommée Not Diamond. La startup a découvert que 85 % des entreprises utilisant l’IA utilisent plusieurs modèles d’IA. Certains modèles sont plus efficaces que d’autres pour certaines tâches. Choisir le bon modèle pour la bonne tâche peut donc être un choix stratégique important pour votre entreprise. Not Diamond crée un « routeur modèle » qui envoie automatiquement les tâches au meilleur modèle.
« Il faut quelqu’un pour le comprendre. Chez IBM, nous croyons en une stratégie de modèle adaptée, ce qui signifie que les bonnes charges de travail nécessitent les bons modèles. Avoir un modèle de routeur qui peut vous aider fait une grande différence », a déclaré Emily Fontaine, responsable du projet chez IBM, à Fortune.

