Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

SoftBank annonce qu’elle investira jusqu’à 75 milliards d’euros pour construire des centres de données français

mai 30, 2026

Les deux plus grands films du week-end ont tous deux été réalisés par des YouTubeurs

mai 30, 2026

SoftBank prévoit d’investir jusqu’à 75 milliards d’euros dans un centre français d’IA

mai 30, 2026
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Meta’s Vanilla Maverick AI Model se classe en dessous des concurrents sur le benchmark de chat populaire
Startups

Meta’s Vanilla Maverick AI Model se classe en dessous des concurrents sur le benchmark de chat populaire

JohnBy Johnavril 11, 2025Aucun commentaire2 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Plus tôt cette semaine, Meta a atterri dans de l’eau chaude pour utiliser une version expérimentale et inédite de son modèle LLAMA 4 Maverick pour obtenir un score élevé sur une référence crowdsourcée, LM Arena. L’incident incite les titulaires de LM Arena à s’excuser, à modifier leurs politiques et à marquer la vanille non modifiée.

Il s’avère que ce n’est pas très compétitif.

Le Maverick non modifié, «Llama-4-Maverick-17b-13b-128e-Instruct», a été classé ci-dessous les modèles inclus GPT-4O d’Openai, Claude 3.5 d’Anthropic et Sonnet et Google’s Gemini 1.5 Pro à vendredi. Beaucoup de ces modèles ont des mois.

La version de version de Llama 4 a été ajoutée à Lmarena après avoir été trouvée qu’elle avait triché, mais vous ne l’avez probablement pas vu parce que vous devez faire défiler jusqu’à la 32e place, c’est où se trouve ranches pic.twitter.com/a0bxkdx4lx

– ρ: ɡσn (@Pigeon__s) 11 avril 2025

Pourquoi la mauvaise performance? Le Maverick expérimental de Meta, Llama-4-Maverick-03-26-Experimental, a été «optimisé pour la conversation», a expliqué la société dans un chat publié samedi dernier. Ces optimisations ont évidemment bien joué à LM Arena, qui fait que les évaluateurs humains comparent les sorties des modèles et choisissent ce qu’ils préfèrent.

Comme nous sommes écrits auparavant, pour diverses raisons, LM Arena n’a jamais été la mesure la plus ravissante des performances d’un modèle d’IA. Pourtant, l’adapter un modèle à une référence – en plus d’être trompeur – rend difficile pour les développeurs de préactivement dans quelle mesure le modèle fonctionnera dans différents contextes.

Dans un statlement, un porte-parole de Meta a déclaré à TechCrunch que la méta-expérience avec «tous les types de variantes personnalisées».

« ‘Llama-4-Maverick-03-26-Experimental’ est une version optimisée de discussion que nous avons vécue avec qui fonctionne également bien sur Lmarena », a déclaré le porte-parole. «Nous avons maintenant publié notre version open source et verrons comment les développeurs personnalisent Llama 4 pour leurs propres cas d’utilisation. Nous sommes ravis de voir ce qu’ils construisent et attendront avec impatience leurs commentaires.





Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleLes startups les plus intéressantes présentées sur Google Cloud Next
Next Article PAP a confirmé l’ardoise pour GE2025. Cela survient au milieu de l’incertitude mondiale: PM Wong
John
  • Website

Related Posts

SoftBank annonce qu’elle investira jusqu’à 75 milliards d’euros pour construire des centres de données français

mai 30, 2026

Les deux plus grands films du week-end ont tous deux été réalisés par des YouTubeurs

mai 30, 2026

Les anciens de Snap dévoilent le fonds Ghost Angels

mai 30, 2026

« Quelle blague » : la nouvelle facturation basée sur des jetons de Github Copilot suscite la consternation parmi les développeurs

mai 30, 2026
Add A Comment
Leave A Reply Cancel Reply

Top Posts

La couche infrastructure sera le véritable champ de bataille du futur système financier

mai 30, 2026

Le co-fondateur de PB Fintech vend des actions d’une valeur de 665 £

mai 29, 2026

5 startups fintech indiennes qui ont retenu notre attention en mai

mai 29, 2026

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

SoftBank annonce qu’elle investira jusqu’à 75 milliards d’euros pour construire des centres de données français

mai 30, 2026

Les deux plus grands films du week-end ont tous deux été réalisés par des YouTubeurs

mai 30, 2026

SoftBank prévoit d’investir jusqu’à 75 milliards d’euros dans un centre français d’IA

mai 30, 2026
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2026 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.