Faites-nous part des mises à jour gratuites
Inscrivez-vous simplement à Myft AI Digest et il sera livré directement à votre boîte de réception.
Les centres de données publiques de la Chine sont emportés par des puces d’intelligence artificielle et sont l’expertise du groupe technologique pour renforcer les milliards de dollars d’investissement dans le cadre d’un effort national pour accroître l’adoption des technologies de développement à grande vitesse.
Selon les personnes connaissant les questions et les documents publics, les gouvernements locaux adoptent le mérite interactif et startup infinie IA et les flux de silicium pour aider à surmonter les centres de données d’IA créés à travers la Chine.
Il montre que la Chine regroupe de plus en plus des ressources des secteurs privé et provincial dans le cadre de ses efforts pour accélérer son réseau d’infrastructures informatiques de l’IA.
« À ce stade, le goulot d’étranglement n’a pas eu de puces, mais nous trouvons des moyens de le faire fonctionner dans le cluster. C’est un travail vraiment compliqué », a déclaré l’investisseur de puces basé à Pékin.
Cette décision est survenue après que la startup chinoise Deepseek a attiré l’attention mondiale le mois dernier avec le dernier d’une série de sorties de modèles d’IA qui se sont produites de manière similaire à des concurrents tels que Openai et Google.
La société basée à Zhijiang utilise son talent d’ingénierie pour réduire autant de puissance de calcul du GPU NVIDIA, réduisant le coût de la formation des modèles et de la soi-disant inférence, et réduit le processus d’appel des modèles de grande langue.
Les centres de données appartenant à l’État tirent parti de ce type de talents d’ingénierie du secteur privé au milieu du boom de l’infrastructure de l’IA à travers la Chine.
Les données officielles montrent qu’à la mi-2024, 250 centres de données d’IA avaient été achevés ou en construction. Selon des personnes familières avec l’accord, les gouvernements locaux financent ces projets d’un milliard de dollars pour émettre des obligations pour obtenir des conseils et des conseils pour ces projets d’un milliard de dollars, selon les gens Cependant, ils ont ajouté que de nombreux projets souffraient d’un manque de savoir-faire technique et ont gaspillé d’importantes ressources en puce.
L’infinigence AI est devenue l’un des principaux bénéficiaires de la poussée de l’État pour signer les accords avec Ningxia et les centres de données nationaux de l’IA de Tianjin.
Soutenue par Hongshan et Qiming Venture Partners, la startup basée à Shanghai prêtera des puces Nvidia aux développeurs créant des applications d’IA. Il fait de l’argent entre la différence en payant l’opérateur du centre de données et ce qui facilite l’accès des clients à l’astuce.
En décembre, le gouvernement de Shanghai sera Infinnigen AI et Startup Silicon Flow pour créer une plate-forme pour que les clients puissent créer des applications d’IA sur des modèles tiers organisés dans des centres de données gérés par des dérivés locaux de China Telecom appartenant à la propriété publique.
Les deux sociétés créeront des moteurs d’inférence qui accélèrent les LLM en adoptant des modèles pré-formés et en s’ajustant de manière appropriée avec les données et en compressant la taille des modèles d’IA.
Un investisseur a déclaré que ces collaborations sont importantes pour courtiser les clients de l’IA. Les entreprises technologiques effectuent des tests avant de signer des contrats avec des centres de données pour s’assurer qu’il n’y a pas de confusion tout en effectuant une formation coûteuse.
Merit Interactive, basée à Zhijiang, tire également parti de son expertise en ingénierie. Le magasin de médias de Zhijiang a publié une réunion avec des cadres interactifs de Merit et des responsables locaux. Là, la société a été choisie pour son rôle dans la construction d’un grand centre de données d’IA dans la ville de Wenzhou.
Le groupe est associé à des partenaires commerciaux de Liang Wenfeng, fondateur de son fonds de trading Quant Deepseek, selon quelqu’un qui connaissait la question.
Selon les médias locaux, Xu Jin, qui a cofondé High Flyer avec Liang, a précédemment travaillé comme directeur technique chez Merit Interactive. Merit Interactive a des avantages commerciaux à travers l’importation et l’exportation de matériel de haute technologie.
Les États-Unis possèdent un ensemble similaire de sociétés « Neocloud », notamment Coreweave, Lambda et Vultr, qui gèrent et locent un accès aux clusters informatiques du centre de données, offrant aux entreprises la possibilité d’utiliser des conseils dans leurs gammes de paiement.
Recommandé
Malgré le resserrement des contrôles d’exportation de Washington sur les puces haut de gamme, la Chine a pu développer son industrie d’IA. Avec les marchés noirs qui prospérent pour les copeaux de contrebande émergents, les initiés de l’industrie ont vu les prix H100 extrêmement populaires au cours des derniers mois, car le nombre de puces illégales apportées en Chine a gonflé, nous nous concentrons sur le déclin.
Les opérateurs de centres de données appartenant à l’État ont préféré l’accès à la puce Ascende AI de Huawei, le principal challenger de la Chine Nvidia pour le marché du raisonnement croissant.
Comme Deepseek, l’infinigence AI et SiliconFlow s’efforcent de réduire les coûts d’inférence à faire de la LLMS moins chère. Nous travaillons également avec Huawei pour rendre la puce Ascend compatible pour déduire avec les principaux modèles d’IA chinois.
Ce mois-ci, Huawei et Siliconflow ont annoncé une collaboration pour rendre le modèle d’IA de Deepseek disponible via le service cloud de Telecom Giant. Selon toute personne connaissant le problème, Deepseek a travaillé avec les deux sociétés pour déployer le modèle à Huawei Chips pendant les vacances du Nouvel An en Chine.
Rapports supplémentaires de Michael Acton de San Francisco