
Après des années passées à construire des modèles d’IA à plus grande échelle, les chercheurs et les fournisseurs d’infrastructures se concentrent de plus en plus sur la question émergente de savoir comment rendre ces systèmes abordables et déployables à grande échelle.
Sara Hooker, co-fondatrice et PDG de la startup AI lab Adaption, a déclaré mardi au public de Fortune Brainstorm Tech que la plupart de l’IA d’aujourd’hui est ce qu’elle appelle « monolithique » ou limitée dans le temps. Autrement dit, une fois qu’un modèle est formé, ses connaissances et ses capacités sont essentiellement figées. Si quelque chose change dans le monde ou si le modèle apprend quelque chose d’utile auprès de l’utilisateur, ces connaissances ne font pas automatiquement partie du modèle.
« Il faut un modèle qui puisse évoluer, sinon il y aura des inefficacités importantes », a-t-elle expliqué.
Pourtant, l’échelle compte pour le moment, et même s’il y aura « beaucoup de place pour l’émergence de modèles plus efficaces », Rodrigo Liang, PDG de la société de puces IA SambaNova, a déclaré que les plus gros modèles ne disparaîtront pas de sitôt. Pour le moment, les clients seront grevés par le coût des modèles réduits, a-t-il expliqué. Infrastructures énergivores. Et vous pouvez trouver suffisamment de côtelettes d’IA.
Mais Hooker s’est concentré sur ce qui suit : nous sommes à un « point de basculement où nous devons vraiment changer l’échelle de cette courbe, cette échelle de ce modèle ». Elle explique que la plupart des gens comprennent intuitivement qu’ils ne doivent pas appliquer le même modèle à chaque problème. « Probablement 90 % des problèmes sont très simples. Par exemple, pour beaucoup de choses que vous faites en masse, vous ne devriez pas lancer un grand modèle. »
Elle a fait valoir que les futurs systèmes d’IA devront s’adapter continuellement aux nouvelles informations et modifier rapidement leur comportement, plutôt que de s’appuyer sur des appels répétés à un modèle fixe. Cette dynamique, a-t-elle déclaré, contribue aux factures élevées d’API que connaissent actuellement de nombreuses entreprises. Les entreprises d’aujourd’hui déploient des agents à grande échelle, mais ces agents n’apprennent souvent pas de leurs erreurs, ce qui oblige les entreprises à payer encore et encore les coûts de calcul, d’appel d’API et d’infrastructure pour les mêmes erreurs.
Alors que les développeurs de modèles comme Hooker se concentrent sur la création de systèmes d’IA plus performants et plus efficaces, le défi urgent de l’industrie est d’exécuter efficacement les modèles à grande échelle d’aujourd’hui afin de rendre le déploiement dans le monde réel économiquement viable, a déclaré Liang. Il a fait valoir que les modèles comportant des milliards de paramètres sont encore trop coûteux et gourmands en énergie, et a déclaré que la stratégie de SambaNova est axée sur une inférence plus rapide avec une consommation d’énergie inférieure grâce à un matériel conçu spécifiquement pour les charges de travail de modèles à grande échelle.
« Nous obtenons des performances deux à trois fois supérieures à celles des Blackwell (GPU) de Nvidia pour exactement le même modèle, nous pensons donc que c’est au moins un moyen de réduire les coûts à grande échelle », a-t-il déclaré.
Détails sur la 25e conférence annuelle Fortune Brainstorming Tech :
Boris Cherny d’Anthropic, créateur de Claude Code, affirme qu’il y a des jours où il gère des dizaines de milliers d’agents IA à la fois.
« Ce n’est pas un moment de panique » : le nouveau PDG de Xbox affirme que la console est ancrée dans le jeu, pas dans l’IA
Le PDG d’Anduril, Brian Shimp, déclare que la guerre économique est la « nouvelle norme » des conflits militaires et que les États-Unis doivent la prendre au sérieux.

