L’unité concompatrice du cloud de Huawei Technologies a travaillé les heures supplémentaires avec une entreprise locale pour faire de la profondeur les vacances du Nouvel An lunaire. Intelligence artificielle (IA) Un modèle qui peut être utilisé par les utilisateurs finaux dans une plate-forme de manière efficace et abordable.
L’unité cloud de Huawei a été créée en coopération avec le flux de silicium de startup d’infrastructure AI basé à Pékin. En profondeurModèle de langage à grande échelle V3 et modèle d’inférence R1, qui peut être utilisé par les utilisateurs finaux via le service Ascend Cloud de Telecom Giant, correspond aux déclarations de samedi selon lesquelles « les modèles Deepseek seront exécutés à la Global Premium Graphic Processing Unit (GPU) ». il.
Selon une autre déclaration de Siliconflow, qui héberge le modèle Deepseek, les frais d’accès à la V3 sur la plate-forme sont réduits à 1 yuan (0,13 $ US), et le jeton de 1 million d’entrée a un jeton de sortie de 1 million. La charge est la même charge. Le modèle R1 a 4 yuans et 16 yuans.
Le mouvement de Huawei et Siliconflow est dû au fait que les modèles Open Source Deepseek gagnent en popularité en Chine et aux États-Unis. L’investisseur OpenAI Microsoft a lancé R1 avec Azure Cloud Computing Platform et GitHub plus tôt cette semaine. Cela permet au client de créer une application d’IA locale. Copilot + ordinateur personnel。 Le géant du commerce électronique Amazon.com peut désormais créer des applications en utilisant R1 avec R1 « puissant et coûteux » via Amazon Web Services.
Le service Ascend Cloud de Huawei a utilisé des solutions Ascend fait maison pour le cluster de serveur d’auto-développement de Huawei, le module AI et la carte d’accélérateur, qui peut contenir divers types de matériel.
Huawei et SiliconFlow n’ont pas spécifié la pointe utilisée dans le service Assend Cloud.