Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

La Maison Blanche demande à OpenAI de ralentir la sortie de son nouveau modèle pour des raisons de sécurité

juin 25, 2026

« Aujourd’hui, je célèbre la victoire de mon peuple » : les Amérindiens célèbrent l’anniversaire de la bataille de Little Bighorn

juin 25, 2026

Les propriétaires de stations-service découvrent une étude de cas sur l’utilisation de l’IA et « s’entendent pour fixer les prix » dans le cadre d’un procès

juin 25, 2026
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Les gens utilisent Super Mario pour comparer l’IA maintenant
Startups

Les gens utilisent Super Mario pour comparer l’IA maintenant

JohnBy Johnmars 3, 2025Aucun commentaire3 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


Pensait que Pokémon était une référence difficile pour l’IA? Un groupe de chercheurs soutient que Super Mario Bros. est encore plus difficile.

Hao AI Lab, une organisation de recherche à l’Université de Californie San Diego, a lancé vendredi l’IA dans les jeux de Super Mario Bros. en direct. Claude 3.7 d’Anthropic a joué le meilleur, suivi de Claude 3.5. GEMINI 1.5 Pro de Google et GPT-4O d’OpenAI ont eu du mal.

Ce n’était pas tout à fait la même version de Super Mario Bros. En tant que sortie originale de 1985, pour être clair. Le jeu a fonctionné dans un émulateur et intégré à un cadre, Kid, pour donner le contrôle de l’AIS sur Mario.

Super Mario Bros. AI Benchmark
Crédits Image: Hao Lab

Je plaisante, que Hao a développé en interne, a nourri les instructions de base de l’IA, comme: «Si un objet stress ou un ennemi est proche, déplacez / sautez à gauche pour esquiver» et des captures d’écran dans le jeu. L’IA a ensuite généré des entrées sous forme de code Python pour contrôler Mario.

Pourtant, Hao dit que le jeu a forcé chaque modèle à «apprendre» à planifier des manœuvres complexes et à développer des stratégies de gameplay. Fait intéressant, le laboratoire a constaté que des modèles soi-disant raisonnement comme O1 d’Openai, qui «pensent» à travers des problèmes étape par étape pour arriver à des solutions, ont permis de moins que des modèles «non-saisonnants», bien qu’ils soient généralement plus forts sur la plupart des repères.

Selon les chercheurs, l’une des principales raisons pour lesquelles les modèles de raisonnement ont des troubles jouant du temps réel, c’est qu’ils prennent un temps des secondes, pour décider des actions, selon les chercheurs. Dans Super Mario Bros., le timing est tout. Une seconde peut signifier la différence entre un saut dégagé en toute sécurité et une chute à mort.

Les jeux sont utilisés pour comparer l’IA depuis des décennies. Mais certains experts ont remis en question la sagesse de lier les liens entre les compétences de jeu de l’IA et les progrès technologiques. Contrairement au monde réel, les jeux ont tendance à être abstraits et relativement simples, et ils fournissent un amour théoriquement infini des données pour former l’IA.

Les récentes références de jeu flashy soulignent ce que Andrej Karpathy, chercheur et membre fondateur d’Openai, a appelé une «crise d’évaluation».

« Je ne sais pas quelles mesures (IA) à regarder en ce moment », a-t-il écrit dans un article sur X. « TLDR Ma réaction est que je ne sais pas à quel point ces modèles sont bons en ce moment. »

Au moins, nous pouvons regarder l’IA jouer à Mario.



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleGeneral Catalyst perd trois principaux investisseurs à mesure que l’entreprise se développe au-delà de Venture, envisage l’introduction en bourse
Next Article Les plaintes de financement automobile augmentent les niveaux record chez le médiateur britannique
John
  • Website

Related Posts

La Maison Blanche demande à OpenAI de ralentir la sortie de son nouveau modèle pour des raisons de sécurité

juin 25, 2026

Les YouTube Shorts deviennent encore plus courts avec une mise à jour qui vous permet de doubler la vitesse de lecture

juin 25, 2026

Patronus AI décroche 50 millions de dollars pour construire des « mondes numériques » qui mettent à l’épreuve les agents d’IA

juin 25, 2026

Polymarket affirme que des pirates ont volé les fonds des utilisateurs

juin 25, 2026
Add A Comment
Leave A Reply Cancel Reply

Top Posts

The AI Race In Fintech Comes Down To One Thing: Trust

juin 25, 2026

The AI Race In Fintech Comes Down To One Thing: Trust

juin 25, 2026

Pourquoi la prochaine licorne fintech pourrait naître d’une idée « ennuyeuse »

juin 24, 2026

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

La Maison Blanche demande à OpenAI de ralentir la sortie de son nouveau modèle pour des raisons de sécurité

juin 25, 2026

« Aujourd’hui, je célèbre la victoire de mon peuple » : les Amérindiens célèbrent l’anniversaire de la bataille de Little Bighorn

juin 25, 2026

Les propriétaires de stations-service découvrent une étude de cas sur l’utilisation de l’IA et « s’entendent pour fixer les prix » dans le cadre d’un procès

juin 25, 2026
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2026 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.