La startup technologique chinoise Deepseek a conclu son projet technologique quotidien avec une réclamation audacieuse avec « Open Source Week ». Son service d’inférence en ligne a généré une marge bénéficiaire extraordinaire de 545% au cours de sa course 24h / 24 grâce à l’optimisation des technologies avancées.
Deepseek a signalé une occupation moyenne de nœuds de 226,75 dans les modèles d’inférence V3 et R1 à partir de midi de Pékin le 27 février, a indiqué samedi dans un poste. Chaque nœud se compose de huit GPU NVIDIA H800 (unités de traitement des graphiques) loués à un coût de 2 $ de l’heure, ce qui porte le coût d’exploitation total à 87 072 $.
Dans le même temps, le modèle a géré un total de 680 milliards de jetons d’entrée et 168 milliards de jetons de sortie, y compris les demandes utilisateur via le Web, les applications mobiles et les interfaces de programmation d’applications (API). Cela égaliserait les revenus de 562 027 USD avec un bénéfice de 545% s’il était facturé en utilisant le modèle de tarification R1 Deepseek.
Un nœud représente les tâches de traitement d’une unité informatique individuelle, tandis que l’occupation du nœud indique l’efficacité d’utilisation pendant les demandes d’inférence. Les jetons d’intelligence artificielle (IA) se réfèrent à l’unité de base des données traitées par un algorithme. Deepseek facture les utilisateurs en fonction du total des jetons d’entrée et de sortie traités par le modèle.
Basée à Hangzhou, province orientale du Zhighiang, Deepseek a pris d’assaut le monde de haute technologie cette année après avoir dévoilé un grand modèle d’IA construit à certains des coûts encourus par de plus grands rivaux américains. La révélation a effacé des milliards de dollars de la valeur marchande des actions technologiques américaines, y compris Nvidia, et a déclenché un taureau dans les actions technologiques chinoises de Hong Kong.
Dans un article sur la plate-forme de questions / réponses en porcelaine de Github et de Zhihu, Deepseek a révélé que les coûts et les revenus sont «théoriques purs». Le modèle V3 est moins cher, les énormes remises hors pointe sur les deux modèles et le service de chatbot gratuit, de sorte que vos revenus réels peuvent être faibles.