Alibaba dévoile Qwen 3, une famille de modèles de raisonnement «hybride»

La société de technologie chinoise Alibaba a publié lundi Qwen 3, une famille de modèles d’IA que la société revendique les matchs et, dans certains cas, surpasse les meilleurs modèles disponibles auprès de Google et Openai.

La plupart des modèles sont – ou seront bientôt – disponibles en téléchargement sous une licence «ouverte» de la plate-forme AI Dev Hugging Face et GitHub. Ils varient en taille de 0,6 milliard de paramètres à 235 milliards de paramètres. Les paramètres correspondent à peu près aux compétences de résolution de problèmes d’un modèle, et les modèles avec plus de paramètres généralement Perforper Boutter que ceux avec moins de paramètres.

La montée des séries de modèles originaires de Chine comme Qwen a accru la pression sur les laboratoires américains tels que OpenAI pour fournir des technologies d’IA plus compétentes. Ils ont également conduit les décideurs à mettre en œuvre des restrictions pour limiter la capacité des entreprises chinoises d’IA à obtenir les puces nécessaires pour former des modèles.

Selon Alibaba, les modèles Qwen 3 sont des modèles «hybrides» dans le sens où ils peuvent prendre du temps et «raisonner» grâce à un problème complexe ou à répondre rapidement aux demandes simples. Le raisonnement permet aux modèles de se vérifier efficacement, similaires à des modèles comme O3 d’OpenAI, mais au prix d’une latence plus élevée.

« Nous avons des modes de pensée et de non-pensée intégrés de manière transparente, offrant aux utilisateurs la flexibilité pour contrôler le budget de réflexion », a écrit l’équipe QWEN dans un article de blog. «Cette conception permet aux utilisateurs de configurer des budgets spécifiques aux tâches avec une plus grande facilité.»

Les modèles Qwen 3 prennent en charge 119 langues, dit Alibaba, et a été formé sur un ensemble de données de près de 36 billions de jetons. Les jetons sont les bits bruts de données qu’un processus modèle; 1 million de jetons équivaut à environ 750 000 mots. Alibaba dit que Qwen 3 a été formé à la combinaison de manuels, «pair de réponses aux questions», extraits de code, données générées par AI, et plus encore.

Ces improvisations, ainsi que d’autres, ont considérablement augmenté la capacité de Qwen 3 par rapport à son prédécesseur, Qwen 2, explique Alibaba. Aucun des modèles Qwen 3 n’est la tête et les épaules au-dessus des modèles récents haut de gamme comme O3 et O4-MinI d’OpenAI, mais ce sont néanmoins des artistes forts.

Sur CodeForces, une plate-forme pour les concours de programmation, le grand QWEN 3 Model-Qwen-3-235B-A22B-Just bat O3-Mini d’Outnai et Gemini 2.5 Pro de Google. QWEN-3-235B-A22B BEAUCOUP O3-MINI SUR LA DERNIÈRE VERSION DE LA LOVE, une référence mathématique difficile, et BFCL, un test pour assassiner la capacité d’un modèle à «raisonner» sur les problèmes.

Mais QWEN-3-235B-A22B n’est pas accessible au public, du moins pas encore.

Benchmarks Alibaba Qwen 3 — Résultats de référence internes d’Alibaba pour Qwen 3.Crédits Image: Alibaba

Le grand modèle public Qwen 3, QWEN3-32B, est toujours compétitif avec un certain nombre de modèles d’IA propriétaires et ouverts, comprenait le R1 de R1 de Deepseek du laboratoire AI chinois. QWEN3-32B dépasse le modèle O1 d’OpenAI sur plusieurs tests, y compris le codage LivecodeBench.

Alibaba dit que Qwen 3 «excelle» dans la capacité d’appel à outils ainsi que les instructions suivantes et la copie de formats de données spécifiques. En plus des modèles de téléchargement, Qwen 3 est disponible auprès des fournisseurs de cloud inclus des feux d’artifice AI et hyperboliques.

Tuhin Srivastava, co-fondateur et PDG d’Ai Cloud Hostten, a déclaré que Qwen 3 est un autre point de la ligne de tendance des modèles ouverts en suivant le rythme du système de source fermée tels que Openai.

« Les États-Unis doublent de la restriction des ventes de puces à la Chine et des achats en Chine, mais des modèles comme Qwen 3 qui sont à la pointe de la technologie et ouverts (…) seront sans aucun doute utilisés au niveau national », a-t-il déclaré à TechCrunch. «Cela reflète la réalité que les entreprises construisent toutes deux leurs propres outils.

Source link

What's Hot

Microsoft dit que l’Asie grimpera la chaîne de valeur de « créé » à « créé » pour devenir une plaque tournante pour l’adoption de l’IA

Openai corrige un «bogue» qui a permis aux mineurs de générer des conversations érotiques

L’inflation alimentaire britannique a atteint 11 mois de plus en avril, les données de l’industrie montrent

Alibaba dévoile Qwen 3, une famille de modèles de raisonnement «hybride»

Openai corrige un «bogue» qui a permis aux mineurs de générer des conversations érotiques

Deel accepte officiellement de recevoir des documents juridiques dans le procès de Rippling

Financial Mysterious demande à Judge d’arrêter la vente d’actifs Canoo

Hugging Face publie un bras robotique imprimé en 3D à partir de 100 $

Volume Doubles UK Fintech en plein essor avec le nouveau fonds de 100 millions de dollars

Paypal lance les revenus fintech alors que les investisseurs craignent l’impact tarifaire de Trump sur les dépenses de consommation – NBC New York

4e programme de formation fintech

Top Insights

Microsoft dit que l’Asie grimpera la chaîne de valeur de « créé » à « créé » pour devenir une plaque tournante pour l’adoption de l’IA

Openai corrige un «bogue» qui a permis aux mineurs de générer des conversations érotiques

L’inflation alimentaire britannique a atteint 11 mois de plus en avril, les données de l’industrie montrent

What's Hot

Alibaba dévoile Qwen 3, une famille de modèles de raisonnement «hybride»

Related Posts

Subscribe to Updates