Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

L’ancien chercheur d’Openai, Lucas Beyer, verse de l’eau froide dans un bonus de méta-signature de 100 millions de dollars

juin 27, 2025

La production de véhicules britanniques a chuté pour la première fois en 76 ans en mai, alors que les tarifs de Trump se sont arrachés

juin 26, 2025

Jahanvi Sardana sur la façon dont les startups remodèlent les marchés à tous les étapes

juin 26, 2025
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Cette semaine dans l’IA: peut-être que nous devrions ignorer les repères de l’IA pour l’instant
Startups

Cette semaine dans l’IA: peut-être que nous devrions ignorer les repères de l’IA pour l’instant

JohnBy Johnfévrier 19, 2025Aucun commentaire5 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Bienvenue dans la newsletter régulière de l’IA de TechCrunch! Je faisais un peu de pause, mais vous pouvez trouver toute notre couverture d’IA, y compris mes colonnes, notre analyse quotidienne et les reportages en train de briser, chez TechCrunch. Si vous voulez ces histoires et bien plus dans votre boîte de réception tous les jours, inscrivez-vous à nos newsletters quotidiennes ici.

Cette semaine, la startup AI du milliardaire Elon Musk, XAI, a publié son dernier modèle phare d’IA, Grok 3, qui alimente les applications Grok Chatbot de l’entreprise. Formé sur environ 200 000 GPU, le modèle bat un certain nombre d’autres modèles de premier plan, notamment d’Openai, sur des repères pour les mathématiques, la programmation, etc.

Mais que nous disent vraiment ces repères?

Ici, à TC, nous rapportons souvent à contrecœur des chiffres de référence, ils sont l’une des rares façons (relativement) normalisées des façons dont le modèle des mesures de l’industrie de l’IA improvise. Les références populaires de l’IA ont tendance à tester le Nowledge ésotérique et à donner des scores agrégés qui sont mal en corrélation à Profice sur les taasks qui se soucient de la plupart des gens.

Alors que le professeur de Wharton Ethan Mollick le souligne dans une série de messages sur X après le dévoilement de Grok 3 lundi, il y a un «besoin urgent de meilleures batteries de tests et d’autorités de test indépendantes». Les sociétés d’IA sont les résultats de référence d’auto-évaluation le plus souvent, comme Mollick l’a fait allusion, ce qui rend ces résultats encore plus difficiles à accepter à leur valeur nominale.

«Les références publiques sont à la fois« meh »et saturées, laissant beaucoup de tests sur l’IA pour être des sorties, sur la base de Tate», a écrit Mollick. «Si est essentiel pour travailler, nous en avons besoin de plus.»

Il ne manque pas de tests et d’organisations indépendants proposant de nouvelles repères pour l’IA, mais leur mérite relatif est loin d’être une affaire établie au sein de l’industrie. Certains commentateurs et experts de l’IA proposent des repères d’alignement avec l’impact économique pour assurer leur utilité, tandis que d’autres soutiennent que l’adoption et l’utilité sont les références ultimes.

Ce débat peut rage jusqu’à la fin des temps. Peut-être devrions-nous à la place, comme le prescrit à l’utilisateur de X, prêtez simplement moins d’attention aux nouveaux modèles et références à moins de percées techniques d’IA majeures. Pour notre santé mentale collective, ce n’est peut-être pas la pire idée, même si elle induit un niveau unique de l’IA FOMO.

Comme mentionné Aboo, cette semaine dans l’IA est en pause. Merci de rester avec nous, les lecteurs, à travers ces montagnes russes d’un voyage. Temps uxt.

Nouvelles

Crédits Image: Nathan Laine / Bloomberg / Getty Images

Openai essaie de «Uncensor» Chatgpt: Max a écrit sur la façon dont Openai modifie son approche de développement de l’IA pour adopter explicitement la «liberté intellectuelle», peu importe à quel point un sujet peut être difficile ou controversé.

La nouvelle startup de Mira: Formez le CTO Openai CTO Mira Murati, Thinking Machines Lab, a l’intention de créer des outils pour «faire fonctionner l’IA pour les besoins et les objectifs uniques des gens».

Grok 3 Cometh: la startup AI d’Elon Musk, Xai, a publié son dernier modèle phare d’IA, Grok 3, et a dévoilé de nouvelles capacités pour les applications Grok pour iOS et le Web.

Une conférence très lama: Meta accueillera sa première conférence dédiée à une IA générative ce printemps. Appelé Llamacon Après la famille des modèles d’IA génératrices de Meta de Meta, la conférence est prévue pour le 29 avril.

L’IA et la souveraineté numérique de l’Europe: Paul a profilé OpenEurollm, A entre les organisations de collection SOE 20 pour construire «une série de modèles de fondation pour l’IA transparent en Europe» qui préserve la «diversité linguistique et culturelle» de toutes les langues de l’UE.

Document de recherche de la semaine

Le site Web d'Openai Chatgpt affiché sur l'écran d'ordinateur portable est vu sur cette photo d'illustration.
Crédits d’image: Jakub Porzycki / Nurphoto / Getty Images

Les chercheurs OpenAI ont créé une nouvelle référence d’IA, Swe-Lance, qui vise à évaluer les prouesses de codage des puissants systèmes d’IA. La référence se compose de plus de 1 400 tâches d’ingénierie logicielle indépendantes qui vont des corrections de bogues et des déploiements de fonctionnalités vers des propulsions techniques «de niveau gestionnaire».

Selon Openai, le modèle d’IA le plus performant, le sonnet Claude 3.5 d’Anthropic, marque 40,3% sur la référence complète de Sweetr que l’IA a beaucoup de chemin à parcourir. Il convient de noter que les chercheurs n’ont pas comparé des modèles plus récents comme O3-Mini ou la société d’IA chinois d’Openai Deepseek’s R1.

Modèle de la semaine

Une société d’IA chinoise nommée StepFun a publié un modèle d’IA «ouvert», Step-Audio, qui peut comprendre et générer une parole en plusieurs langues. Step-Audio prend en charge le chinois, l’anglais et le japonais et permet aux utilisateurs d’ajuster l’émotion et même le dialecte de l’audio synthétique qu’il crée, inclus.

Stepfun est l’une des nombreuses startups d’IA chinois bien financées libérant des modèles sous une licence permissive. Fondée en 2023, Stepfun aurait récemment clôturé un tour de financement d’une valeur de plusieurs millions de chances d’une multitude d’investisseurs qui comprenaient des sociétés chinoises de capital-investissement appartenant à l’État.

Sac à main

Nous recherchons des Deeppermes
Crédits d’image: nous recherchons

We Research, un groupe de recherche sur l’IA, a publié ce qu’il prétend être l’un des premiers modèles d’IA qui unifie le raisonnement et les «capacités de modèle de langage intuitif».

Le modèle, Deepheremes-3 Preview, peut basculer sur et désactiver de longues «chaînes de pensée» pour une amélioration de l’acccaracy au prix d’une heft informatique. En mode «raisonnement», l’aperçu des deepheremes-3, similaire à d’autres modèles de raisonnement d’IA, «pense» plus longtemps pour des problèmes plus difficiles et montre que son processus de réflexion arrive à la réponse.

Anthropic prévoit de publier un modèle similaire architectural bientôt, et Openai a déclaré qu’un tel modèle était sur sa feuille de route à court terme.



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous Article«  Dreamer  » de la carrière »de Google utilise l’IA pour vous aider à explorer la possibilité d’emploi
Next Article XRP News aujourd’hui: XRP augmentera de 6,9% au milieu du retrait de l’appel de la SEC. BTC latéralement
John
  • Website

Related Posts

Jahanvi Sardana sur la façon dont les startups remodèlent les marchés à tous les étapes

juin 26, 2025

Google lance Doppl, une nouvelle application qui vous permet de visualiser à quoi pourrait vous ressembler une tenue

juin 26, 2025

Pourquoi A16Z VC pense que Clululley, la startup «  Cheat on Everything  », est le nouveau plan pour les startups IA

juin 26, 2025

Chris Gardner de sous-traitant VC mène une session AI à tous les parcours

juin 26, 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Comment le fondateur milliardaire de Revolut réinvente le voyage de luxe

juin 26, 2025

Fintech Major Pine Labs Fichier avec Rs 2 600 crore IPO – IPO News

juin 26, 2025

L’Inde est parmi les meilleurs hotspots finch du monde: la recherche WEF

juin 25, 2025

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

L’ancien chercheur d’Openai, Lucas Beyer, verse de l’eau froide dans un bonus de méta-signature de 100 millions de dollars

juin 27, 2025

La production de véhicules britanniques a chuté pour la première fois en 76 ans en mai, alors que les tarifs de Trump se sont arrachés

juin 26, 2025

Jahanvi Sardana sur la façon dont les startups remodèlent les marchés à tous les étapes

juin 26, 2025
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2025 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.