Claude AI da Anthropic está jogando Pokémon no Twitch — lentamente

Na tarde de terça-feira, a Anthropic lançou Claude Plays Pokémon no Twitch, uma transmissão ao vivo do mais novo modelo de IA da Anthropic, Claude 3.7 Sonnet , jogando uma partida de Pokémon Red. Tornou-se uma espécie de experimento fascinante, mostrando as capacidades da tecnologia de IA de hoje e as reações das pessoas a elas.
Pesquisadores de IA usaram todos os tipos de videogames , de Street Fighter a Pictionary , para testar novos modelos — geralmente mais por diversão do que por utilidade. Mas Anthropic disse que Pokémon provou ser um benchmark útil para Claude 3.7 Sonnet, que pode efetivamente "pensar" nos tipos de quebra-cabeças que o jogo contém.
Assim como o o3-mini da OpenAI e o R1 da DeepSeek, o Claude 3.7 Sonnet pode “raciocinar” seu caminho através de desafios difíceis, como jogar um videogame projetado para crianças. Enquanto o predecessor não raciocinador do modelo, o Claude 3.5 Sonnet , falhou logo no começo do Pokémon Red — saindo da casa do jogador em Pallet Town — o Claude 3.7 Sonnet conseguiu ganhar três insígnias de líder de ginásio.

O mais novo Claude ainda tem problemas, no entanto. Horas depois do stream no Twitch, o modelo foi dissuadido por uma parede de pedra, que ele não conseguia atravessar, não importa o quanto tentasse.
Um usuário do Twitch resumiu a situação desta forma: “quem venceria, uma IA de computador com milhares de horas investidas em programação ou uma parede de pedra?”
Por fim, Claude percebeu que ele conseguia contornar a parede.
Por um lado, é frustrante assistir Claude atravessar Pokémon Red com a velocidade de um Slowpoke , raciocinando em cada passo com contemplação excruciante. Mas também é estranhamente atraente. A esquerda do fluxo mostra o "processo de pensamento" de Claude, enquanto a direita mostra a jogabilidade em tempo real.
Em um momento, Claude tentou localizar o Professor Carvalho dentro de seu laboratório, mas ficou confuso, porque havia outros NPCs na cena.
“Percebi que um novo personagem apareceu abaixo de mim — um personagem com cabelo preto e o que parece ser um jaleco branco nas coordenadas (2, 10)”, escreveu Claude. “Este pode ser o Professor Carvalho! Deixe-me descer e falar com ele.”
Claude então começou a falar por engano com um NPC que não era o Processor — um NPC com quem o modelo havia falado várias vezes antes. Algumas das milhares de pessoas no chat do Twitch começaram a ficar inquietas. Outros, particularmente aqueles que estavam assistindo à transmissão por mais de alguns minutos, ficaram menos preocupados.
“Gente, relaxem”, escreveu uma pessoa no chat. “Antes de sairmos e entrarmos no laboratório do Oak umas 10 vezes antes de entender como seguir em frente.”

Para usuários antigos do Twitch, o formato do stream do Anthropic pode parecer nostálgico. Mais de uma década atrás, milhões de pessoas tentaram jogar Pokémon Red ao mesmo tempo em um experimento social online inédito chamado Twitch Plays Pokémon . Cada usuário podia controlar o personagem do jogador via chat do Twitch, resultando em uma jogabilidade previsivelmente caótica.
Alguns pesquisadores de IA citaram o Twitch Plays Pokémon como inspiração para seu trabalho. Em outubro de 2023, o engenheiro de software Peter Whidden, de Seattle, publicou um vídeo no YouTube detalhando como ele treinou um algoritmo de aprendizado por reforço para jogar Pokémon. Sua IA passou mais de 50.000 horas jogando o jogo antes de aprender a navegar com sucesso. Um desafio era que a IA preferia admirar o cenário pixelado em vez de realmente jogar o jogo.
“Reencenações” alimentadas por IA de Pokémon do Twitch Plays como Whidden e Anthropic são divertidas, mas um pouco agridoces ao mesmo tempo. A transmissão original foi um momento crucial na história do Twitch porque uniu as pessoas de uma forma inesperada. Todos estavam no mesmo time, trabalhando para atingir o objetivo de fazer o personagem do jogador parar de correr em círculos e realmente progredir no jogo.
Em 2025, parece que não somos mais companheiros de equipe, mas espectadores, assistindo a um modelo de IA tentar jogar um jogo que muitos de nós pegamos o jeito quando tínhamos cinco anos de idade. É um microcosmo motivado por IA de uma tendência maior: nossas experiências online estão mudando de atividades compartilhadas e comunitárias para atividades mais solitárias.
techcrunch