Nous tuons l’après-midi, Anthropic a lancé Claude joue Pokémon sur Twitch, un livestream du nouveau modèle d’IA d’Anthropic, Claude 3.7 Sonnet, jouant à un jeu de Pokémon Red. C’est devenu une sorte d’expérience fascinante, présentant les capacités de la technologie de l’IA d’aujourd’hui et les réactions des gens à leur manière.
Les chercheurs d’IA ont utilisé tous les sorts de jeux vidéo, de Street Fighter à Pictionary, pour tester de nouveaux modèles – souvent plus pour l’amusement que l’utilité. Mais Anthropic a déclaré que Pokémon s’est avéré être une référence utile pour Claude 3.7 Sonnet, qui peut effectivement «penser» à travers les sorts de puzzles que le jeu contient.
Comme O3-Mini d’Openai et R1 de Deepseek, Claude 3.7 Sonnet peut «raisonner» à travers des défis difficiles difficiles, comme jouer à un jeu vidéo conçu pour les enfants. Alors que le prédécesseur non renvoyé du modèle, Claude 3.5 Sonnet, a échoué au tout début de Pokémon en rouge en exploitant le domicile du joueur à Pallet Town-Claude 3.7 Sonnet a réussi à remporter trois badges de chef de gym.

Le nouveau Claude rencontre toujours des troubles. Des heures dans le ruisseau Twitch, le modèle a été dissuadé par une paroi rocheuse, qu’il ne pouvait pas traverser, peu importe à quel point il a essayé.
Un utilisateur de Twitch a résolu le chemin: « Qui gagnerait, une AI informatique avec des milliers d’heures mises en programmation, ou 1 paroi rocheuse? »
Finalement, Claude s’est rendu compte qu’il pouvait naviguer autour du mur.
D’une part, il est frustrant de voir Claude traverser Pokémon Red avec la vitesse d’un SlowPoke, raisonnement à travers chaque étape avec une contemplation atroce. Pourtant, c’est aussi étrangement créant. La gauche du flux montre le «processus de pensée» de Claude, tandis que la droite montre un gameplay en temps réel.
À un moment donné, Claude a tenté de localiser le professeur Oak dans son laboratoire, mais s’est confus, car il y a d’autres PNJ dans la scène.
« Je remarque qu’un nouveau personnage a apaisé en dessous de moi – un personnage aux cheveux noirs et ce qui semble être une couche blanche aux coordonnées (2, 10) », a écrit Claude. «C’est peut-être le professeur Oak! Laissez-moi descendre et lui parler. «
Claude a ensuite parlé à tort à un PNJ autre que le professeur – un PNJ avec lequel le modèle avait parlé à plusieurs reprises auparavant. Certaines des mille personnes dans le chat Twitch ont commencé à devenir impatientes. D’autres, en particulier ceux qui regardaient le flux depuis plus de quelques minutes, Wre moins le monde.
« Les gars se détendent », a écrit une personne dans le chat. « Avant que nous externes et entrons dans le laboratoire d’Oak comme 10 fois avant de comprendre comment continuer. »

Pour les utilisateurs de longue date de Twitch, le format du flux d’Anthropic pourrait sembler nostalgique. Il y a plus d’une décennie, des millions de personnes ont tenté de jouer à Pokémon Red à la fois dans une première expérience sociale en ligne appelée Twitch Plays Pokémon. Chaque utilisateur pourrait contrôler le personnage du lecteur via Twitch Chat, ce qui résulte en un gameplay chaotique prédéablement.
Certains chercheurs de l’IA ont cité Twitch joue Pokemon comme une inspiration pour leur travail. En octobre 2023, l’ingénieur logiciel basé à Seattle, Peter Whidden, a publié une vidéo YouTube détaillant comment il a formé un algorithme d’apprentissage de renforcement pour jouer à Pokémon. Son IA a passé plus de 50 000 heures à jouer au jeu avant qu’il n’apprenne à y naviguer avec succès. Un défi était que l’IA préférait admirer le paysage pixélé au lieu de jouer le jeu.
Les «reconstitutions» de l’AI-Power de Twitch jouent des Pokémon comme Whidden’s et Anthropic sont divertissants, mais un peu doux-amers en même temps. Le flux d’origine a été un moment si charnière de l’histoire de Twitch car il était à tout le monde dans la même équipe, travaillant vers le but d’amener le personnage du joueur à arrêter de courir en rond et à progresser dans le jeu.
En 2025, il semble que nous n’étions pas de longs coéquipiers, mais les spectateurs, en regardant un modèle d’IA, essayer de jouer à un jeu de Marie de nous, nous avons eu la priorité quand nous avions cinq ans. Il s’agit d’un microcosme motivé par l’IA d’une tendance plus large: nos expériences en ligne passent de la communauté et communes plus solitaires.