Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

La banque centrale de la Russie réduit les taux d’intérêt pour la première fois depuis 2022

juin 6, 2025

Pourquoi Genai est «l’archéologue d’entreprise» dont chaque entreprise a besoin

juin 6, 2025

Hedgefunder Ken Griffin ne comprend pas pourquoi Trump veut prendre le travail de la Chine: « Pourquoi voulons-nous être le pays de travail le moins cher du monde? »

juin 6, 2025
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Le nouveau modèle R1 AI distillé de Deepseek peut fonctionner sur un seul GPU
Startups

Le nouveau modèle R1 AI distillé de Deepseek peut fonctionner sur un seul GPU

JohnBy Johnmai 29, 2025Aucun commentaire2 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Le modèle de raisonnement R1 mis à jour de Deepseek pourrait attirer l’attention de l’attention de la communauté de l’IA cette semaine. Mais le laboratoire de l’IA chinois a également publié une version plus petite et «distillée» de son nouveau R1, Deepseek-R1-0528-QWEN3-8B, qui prétend que Deepseek bat des modèles de taille comparable sur certains repères.

Le plus petit R1 mis à jour, qui a été construit à l’aide du modèle QWEN3-8B, Alibaba a été lancé en mai comme fondation, mieux que Google’s Gemini 2.5 Flash que nous aimons 2025, une collection de questions mathématiques difficiles.

Deepseek-R1-0528-QWEN3-8B ​​a également nécessaire le modèle de raisonnement PHI 4 plus publié par Microsoft sur un autre test de compétences en mathématiques, HMMT.

Les modèles dits distillés comme Deepseek-R1-0528-QWEN3-8B ​​sont généralement moins capables de homologues de taille normale. Du côté le plus, ils sont beaucoup moins exigeants en calcul. Selon la plate-forme Cloud NodeHift, Qwen3-8b nécessite un GPU avec 40 Go-80 Go de RAM à fonctionner (par exemple, un NVIDIA H100). Le nouveau R1 en taille réelle a besoin d’environ une douzaine de GPU 80 Go.

Deepseek formé Deepseek-R1-0528-QWEN3-8B ​​en prenant du texte généré par le R1 mis à jour et en l’utilisant pour affiner Qwen3-8b. Dans une page Web dédiée pour le modèle sur la plate-forme AI Dev Huging Face, Deepseek décrit Deepseek-R1-0528-QWEN3-8B ​​comme «pour la recherche académique sur les modèles de raisonnement et le développement industriel axé sur les modèles à petite échelle.

Deepseek-R1-0528-QWEN3-8B ​​est disponible sous une licence MIT permissive, ce qui signifie qu’elle peut être commercialement sans restriction. Plusieurs hôtes, dont LM Studio, proposent déjà le modèle via une API.



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleEntreprise technologique gouvernementale américaine impliquée dans des cyber-escroqueries
Next Article YouTube permettra bientôt aux téléspectateurs utiliser Google Lens pour rechercher ce qu’ils voient tout en regardant des shorts
John
  • Website

Related Posts

Le tribunal refuse la demande d’Apple de mettre en pause la décision sur les frais de paiement de l’App Store

juin 6, 2025

Comment les startups de l’IA mènent la bataille contre les attaques sophistiquées de phistenance

juin 6, 2025

Comment choisir le meilleur logiciel de base de connaissances pour votre entreprise

juin 6, 2025

L’évaluation de 9,9 milliards de dollars du curseur NABS NABS, s’évanouit de 500 millions de dollars

juin 5, 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

FinTech et Neobanks poussent les banques à repenser l’avenir des dépôts

juin 5, 2025

UK Fintechwise se tourne vers le marché américain pour promouvoir ses ambitions mondiales

juin 5, 2025

La technologie héritée afflige toujours 95% de la banque Asie-Pacifique, ralentissant la modernisation

juin 5, 2025

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

La banque centrale de la Russie réduit les taux d’intérêt pour la première fois depuis 2022

juin 6, 2025

Pourquoi Genai est «l’archéologue d’entreprise» dont chaque entreprise a besoin

juin 6, 2025

Hedgefunder Ken Griffin ne comprend pas pourquoi Trump veut prendre le travail de la Chine: « Pourquoi voulons-nous être le pays de travail le moins cher du monde? »

juin 6, 2025
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2025 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.