Le modèle d’IA le plus cher de Google semble avoir franchi une étape importante: battre un jeu vidéo de 29 ans.
Hier soir, le PDG de Google Sundar Pichai a publié triomphalement sur X, « Quelle finition! Gemini 2.5 Pro vient de terminer Pokémon Blue! »
Pour être clair, le Gemini joue Pokemon Livestream a été créé par (selon ses propres mots) « un ingénieur logiciel de 30 ans non affilié à Google » qui passe par Joel Z. Mais les dirigeants de Google ont encouragé le.
Par exemple, Logan Kilpatrick, le chef de file du produit pour Google AI Studio, a posté le mois dernier que Gemini «faisait de grands progrès pour terminer Pokémon» et avait «gagné son 5e badge (le prochain meilleur modèle n’a que 3 jusqu’à présent, bien qu’avec un huissier d’agent différent)», a dirigé Pichai pour plaisanter, «nous travaillons sur API, avec un peu de pokémon artificiel :)».
Pourquoi Pokémon? En février, Anthropic a souligné les progrès que ses modèles Claude AI faisaient dans «Pokémon Red», écrivant que la «Thinking End Agent Training» de Claude lui donne «un coup de pouce majeur» sur les tâches «plus unxperde», comme jouer à un jeu classique. («Pokémon Red» et «Blue» sont des versions différentes d’un titre Gameboy pour la première fois en 1996 et liées à la franchise Pokémon de longue date). Il y a même une chaîne Pokemon Twitch Claude joue que Joel Z a cité comme une inspiration.
Malgré ses progrès, Claude des Not Apperar pour encore avoir «Pokémon Red». Cela signifie-t-il que les Gémeaux sont mieux objectifs au jeu? Sur sa page Twitch, Joel Z a exhorté les téléspectateurs: «S’il vous plaît, considérez ceci comme une référence pour la façon dont un LLM peut jouer à Pokémon. Vous pouvez vraiment faire des comparaisons directes – Gemini et Claude ont différents outils et recevoir différentes informations.»
Et les deux modèles d’IA ont besoin d’aide pour jouer au jeu – c’est là que les harnais d’agent susmentionnés entrent en jeu, fournissant aux modèles des captures d’écran de jeu superposées d’informations supplémentaires, permettant au modèle de décider comment replonger (ce qui peut impliquer d’appeler des agents spécialisés), puis d’appuyer sur le bouton qui correspond à l’instruction de l’IA.
Événement TechCrunch
Berkeley, que
|
5 juin
Réserver maintenant
Joel Z a reconnu qu’il y avait d’autres «interventions de développement» pour aider les Gémeaux à terminer le jeu, mais nous avons insisté sur le fait qu’il ne trichait pas.
«Mes interventions améliorent les capacités globales de prise de décision et de raisonnement des Gémeaux», dit-il. «Je ne donne pas des conseils spécifiques – il n’y a pas de procédures pas à pas ou d’instructions directes pour des défis particuliers comme. Moon. La seule chose qui se rapproche encore est de faire savoir aux Gémeaux qu’il doit parler à des grognements de fusée deux fois pour obtenir la clé de l’ascenseur, qui a ensuite été fixée en jaune Pokémon.»
De plus, il a dit: «Gemini joue Pokémon est toujours en cours de développement, et le cadre continue d’évoluer.»