Deepseek a mis à jour son modèle R1 AI il y a quelques jours. Il a amélioré les performances et est moins cher que la plupart des autres modèles top.
Avez-vous manqué cela? Je l’ai manqué. Ou je viens de regarder les nouvelles et je l’ai oublié. La plupart des industries technologiques et des investisseurs étaient dans le lancement avec un énorme haussement d’épaules.
Cela contraste très au début de 2025 lorsque le modèle R1 de Deepseek a été choqué par tout le monde. Les actions de haute technologie ont chuté et le boom des dépenses génératrices de l’IA a été sérieusement remis en question.
Cette fois, le déploiement Deepseek « a basculé sans blip », a écrit Ross Sandler, analyste de la technologie de la technologie chez Barclays, dans une note aux investisseurs.
« Le marché boursier ne pourrait pas être trop dérangé », a-t-il ajouté. « Cela montre que le niveau de compréhension de la communauté des investissements concernant le commerce de l’IA s’est considérablement amélioré en seulement cinq mois. »
Sondages en profondeur non scientifique
Vendredi, j’ai voté pour mes collègues pour l’équipe technologique de Business Insider. J’ai regardé Elon Musk et Donald Trump discuter sur les réseaux sociaux (plutôt que de faire un vrai travail) et je les ai vus prendre trop de temps.
Voici quelques-unes de leurs réponses:
Un éditeur a déclaré qu’il n’avait pas remarqué la mise à jour Deepseek, mais maintenant il se sent coupable de ne pas l’avoir trouvé. (Pensée standard. Seules les délires survivent dans le journalisme). Un autre collègue a dit qu’il le savait à partir de leurs têtes de titre rapide, mais qu’il n’en avait pas beaucoup lu à ce sujet. Le journaliste technique a examiné le fil éditorial à ce sujet, l’a scanné à ce sujet et n’y a plus pensé.
Il était donc à peine enregistré. Et ces gens sont collés à des nouvelles de haute technologie chaque seconde de la journée.
Pourquoi personne ne s’en soucie vraiment maintenant?
Le dernier modèle R1 de Deepseek est probablement le troisième meilleur au monde en ce moment, alors pourquoi ne font-ils pas des vagues comme avant?
Graphique montrant les performances de divers modèles d’IA Recherche de Barclays
Sandler, un analyste de Barclays, a déclaré que les derniers produits de Deepseek étaient relativement moins bon marché qu’auparavant. Cela coûte moins de 1 million de dollars de jetons. C’était environ 27 fois moins cher que le modèle O1 d’Openai plus tôt cette année.
Graphique montrant les prix de divers modèles d’IA basés sur les dollars américains par million de jetons Recherche de Barclays
Actuellement, le R1 de Deepseek est environ 17 fois moins cher que le modèle top, selon la recherche et les données de l’indice d’intelligence de l’IA pour l’analyse artificielle.
Un graphique montrant les coûts de divers modèles d’IA basés sur les dollars par million de jetons. Recherche de Barclays
Cela montre un point plus large et plus important. Ce que je vous dis depuis l’année dernière: la plupart des meilleurs modèles d’IA ont des performances similaires car elles sont principalement formées sur les mêmes données sur Internet.
Histoires connexes
Cela rend difficile de se démarquer de la foule en fonction des performances. Lorsque vous sautez, vos inventions et avantages sont rapidement incorporés dans tout le reste.
Oui, le prix compte. Cependant, la distribution devient plus importante. Par exemple, si votre employeur a un compte ChatGpt Enterprise, il est très probable que vous utiliserez le modèle OpenAI au travail. C’est facile. Si vous avez un smartphone Android, vous parlerez probablement au chatbot Gemini de Google et obtiendrez des réponses des modèles d’IA du géant de la recherche.
Deepseek n’a pas encore une large distribution de cette espèce, du moins dans le monde occidental.
L’infrastructure de l’IA a-t-elle été erronée malavisée?
Deuxièmement, il y a la reconnaissance que des modèles « inférence » tels que R1 de Deepseek et O3 d’OpenAI nécessitent d’énormes quantités de puissance de calcul à exécuter. Cela est dû à la capacité de détruire les demandes en plusieurs étapes de «réflexion». Chaque étape est un nouveau type d’invite, se transformant en un grand nombre de nouveaux jetons qui doivent être traités.
Le Freakout Deepseek de janvier est venu principalement parce que l’industrie technologique craignait que le laboratoire chinois n’ait développé des modèles plus efficaces qui ne nécessitaient pas plus d’infrastructures informatiques.
En fait, ce laboratoire chinois a peut-être aidé à populariser ces nouveaux types de modèles d’inférence à la place.
Inscrivez-vous à notre newsletter hebdomadaire BI Tech Memo.