Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

C’était un « bon étudiant », mais il a sauté l’université et a rencontré un électricien de 23 ans qui deviendrait son patron. Il fait six numéros

septembre 14, 2025

Les ingénieurs de l’IA sont déployés en tant que consultants et sont payés 900 $ par heure

septembre 14, 2025

La star de « Million Dollar Listing » Fredrik Ecklund dit que Gen Z n’a pas besoin d’un diplôme universitaire pour arriver sur l’immobilier: « Vous devez sortir dans la rue. »

septembre 14, 2025
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Les repères de Meta pour ses nouveaux modèles d’IA sont un peu trompeurs
Startups

Les repères de Meta pour ses nouveaux modèles d’IA sont un peu trompeurs

JohnBy Johnavril 6, 2025Aucun commentaire2 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


L’un des nouveaux modèles phares AI Meta publiés samedi, Maverick, se classe deuxième sur LM Arena, un test qui a des évaluateurs humains comparer les résultats des modèles et choisir ce qu’ils préfèrent. Mais il semble que la version de Maverick que Meta déployée sur LM Arena diffère de la version largement disponible pour les développeurs.

Comme plusieurs chercheurs d’IA l’ont souligné sur X, Meta-Neda dans son annonce que le Maverick sur LM Arena est une «version de chat expérimentale». Un graphique sur le site officiel de Llama, quant à lui, révèle que les tests LM Arena de META effectuaient en utilisant «Llama 4 Maverick optimisé pour la conversation».

Comme nous sommes écrits auparavant, pour diverses raisons, LM Arena n’a jamais été la mesure la plus ravissante des performances d’un modèle d’IA. Mais les sociétés d’IA n’ont généralement pas personnalisé ou affiné leurs modèles pour marquer Beter sur LM Arena ou n’ont pas admis de le faire, au moins.

Le problème de l’adaptation d’un modèle à une référence, de la retenir, puis de la libération d’une variante «vanille» de ce même modèle est qu’il est difficile pour les développeurs de prédire à quel point le modèle fonctionnera dans des contextes particuliers. C’est aussi trompeur. Idéalement, les références – terriblement inadéquates comme elles sont – fournissent un instantané des forces et des faiblesses d’un seul modèle à travers une rage de tâches.

En effet, les chercheurs sur X ont observé des difficultés stark dans le comportement du Maverick téléchargeable public par rapport au modèle hébergé sur LM Arena. La version LM Arena semble utiliser beaucoup d’emojis et donner des réponses incroyablement longues.

Oks llama 4 est def un coked Lold Lol, qu’est-ce que ce yap ville pic.twitter.com/y3gvhbvz65

– Nathan Lambert (@natolambert) 6 avril 2025

Pour une raison quelconque, le modèle Llama 4 dans Arena utilise beaucoup plus d’emojis

Sur ensemble. AI, cela semble mieux: pic.twitter.com/f74odx4ztt

– Tech Dev Notes (@TechDevnotes) 6 avril 2025

Nous avons contacté Meta et Chatbot Arena, l’organisation qui Maintenance LM Arena, pour commenter.





Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleLes actions de Singapour voient la plus grande baisse depuis la crise financière mondiale alors que les IST ont chuté de 7,5%
Next Article L’objectif EV a été édulcoré pour soutenir les tarifs dans l’industrie automobile du Royaume-Uni
John
  • Website

Related Posts

Le président du conseil d’administration de Tesla appelle le débat sur le pack de paiement de 1 t $ d’Elon Musk ‘Un peu bizarre’

septembre 13, 2025

L’union pilote exhorte la FAA à rejeter le plan de grasion des nuages ​​de drones de Rainmaker du Rainmaker

septembre 13, 2025

Les législateurs de Californie adoptent l’IA de la sécurité du projet de loi SB 53 – mais Newsom pourrait encore opposer son veto

septembre 13, 2025

3 erreurs financières comme les nouveaux entrepreneurs font lors de la planification de l’avenir de leurs enfants

septembre 13, 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Fichiers LendBuzz FinTech Lendch FinTech pour les introductions en bourse

septembre 12, 2025

Comment les crypto-monnaies, les fintechs et l’IA peuvent remodeler la géopolitique mondiale de l’avenir

septembre 11, 2025

APAC offre un grand potentiel de croissance, mais le succès nécessite une stratégie de paiement localisée

septembre 11, 2025

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

C’était un « bon étudiant », mais il a sauté l’université et a rencontré un électricien de 23 ans qui deviendrait son patron. Il fait six numéros

septembre 14, 2025

Les ingénieurs de l’IA sont déployés en tant que consultants et sont payés 900 $ par heure

septembre 14, 2025

La star de « Million Dollar Listing » Fredrik Ecklund dit que Gen Z n’a pas besoin d’un diplôme universitaire pour arriver sur l’immobilier: « Vous devez sortir dans la rue. »

septembre 14, 2025
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2025 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.