Microsoft a déployé cette semaine sa première récolte de ses puces d’IA locales dans l’un de ses centres de données, et prévoit d’en déployer davantage dans les mois à venir, indique-t-il.
La puce, baptisée Maia 200, est conçue pour être ce que Microsoft appelle une « centrale d’inférence d’IA », ce qui signifie qu’elle est optimisée pour le travail de calcul intensif consistant à exécuter des modèles d’IA en production. La société a publié des spécifications impressionnantes en matière de vitesse de traitement pour Maia, affirmant qu’elle surpasse les dernières puces Trainium d’Amazon et les dernières unités de traitement Tensor (TPU) de Google.
Tous les géants du cloud se tournent vers leurs propres conceptions de puces d’IA, en partie à cause de la difficulté et du coût liés à l’obtention des dernières et meilleures qualités de Nvidia – une pénurie d’approvisionnement qui ne montre aucun signe de ralentissement.
Mais même avec sa propre puce de pointe et hautes performances, le PDG de Microsoft, Satya Nadella, a déclaré que la société continuerait d’acheter des puces fabriquées par d’autres.
« Nous avons un excellent partenariat avec Nvidia et AMD. Ils innovent. Nous innovons », a-t-il expliqué. « Je pense que beaucoup de gens parlent simplement de qui est en avance. N’oubliez pas que vous devez être en avance pour toujours. »
Il a ajouté : « Parce que nous pouvons intégrer verticalement, cela ne signifie pas que nous nous contentons d’intégrer verticalement », ce qui signifie construire nos propres systèmes de haut en bas, sans utiliser les produits d’autres fournisseurs.
Cela dit, Maia 200 sera utilisé par l’équipe dite de Superintelligence de Microsoft, les spécialistes de l’IA construisant les propres modèles frontières du géant du logiciel. C’est ce qu’affirme Mustafa Suleyman, l’ancien cofondateur de Google DeepMind qui dirige désormais l’équipe. Microsoft travaille sur ses propres modèles pour peut-être un jour réduire sa dépendance à l’égard d’OpenAI, d’Anthropic et d’autres créateurs de modèles.
Événement Techcrunch
Boston, Massachusetts
|
23 juin 2026
La puce Maia 200 prendra également en charge les modèles OpenAI fonctionnant sur la plate-forme cloud Azure de Microsoft, indique la société. Mais, de l’avis de tous, sécuriser l’accès au matériel d’IA le plus avancé reste un défi pour tout le monde, aussi bien pour les clients payants que pour les équipes internes.
Ainsi, dans un article sur X, Suleyman a clairement apprécié d’annoncer que son équipe était la première à avoir la chance. «C’est un grand jour», a-t-il écrit lors du lancement de la puce. « Notre équipe Superintelligence sera la première à utiliser Maia 200 pour développer nos modèles d’IA de pointe. »

