Искусственный интеллект Клода от Anthropic играет в Pokémon на Twitch — медленно

Во вторник днем Anthropic запустил Claude Plays Pokémon на Twitch, прямую трансляцию новейшей модели искусственного интеллекта Anthropic, Claude 3.7 Sonnet , играющей в Pokémon Red. Это стало своего рода увлекательным экспериментом, демонстрирующим возможности современных технологий искусственного интеллекта и реакцию людей на них.
Исследователи ИИ использовали всевозможные видеоигры , от Street Fighter до Pictionary , для тестирования новых моделей — часто больше для развлечения, чем для пользы. Но Anthropic заявил, что Pokémon оказался полезным эталоном для Claude 3.7 Sonnet, который может эффективно «думать» через виды головоломок, которые содержит игра.
Как и o3-mini от OpenAI и R1 от DeepSeek, Claude 3.7 Sonnet может «рассуждать» о своем пути через сложные испытания, например, играть в видеоигру, предназначенную для детей. В то время как предшественник модели, не обладающий рассуждениями, Claude 3.5 Sonnet , провалил самое начало Pokémon Red — выйдя из дома игрока в городе Паллет, — Claude 3.7 Sonnet сумел выиграть три значка лидера спортзала.

Однако новейший Клод все еще сталкивается с трудностями. Спустя несколько часов после начала трансляции на Twitch модель остановила каменная стена, через которую она не смогла пройти, как бы ни старалась.
Один из пользователей Twitch охарактеризовал ситуацию следующим образом: «Кто победит: компьютерный ИИ, на программирование которого были потрачены тысячи часов, или одна каменная стена?»
В конце концов Клод понял, что он может перемещаться вокруг стены.
С одной стороны, раздражает наблюдать, как Клод пересекает Pokémon Red со скоростью Slowpoke , обдумывая каждый шаг с мучительным размышлением. Но это также странно захватывающе. Слева от трансляции показан «мыслительный процесс» Клода, а справа — игровой процесс в реальном времени.
В какой-то момент Клод попытался найти профессора Оука в его лаборатории, но запутался, поскольку на месте происшествия были и другие NPC.
«Я заметил, что подо мной появился новый персонаж — персонаж с черными волосами и, судя по всему, в белом халате в точке с координатами (2, 10)», — написал Клод. «Это может быть профессор Оук! Позвольте мне спуститься и поговорить с ним».
Затем Клод по ошибке начал говорить с NPC, отличным от Процессора — NPC, с которым модель уже несколько раз общалась. Некоторые из тысячи с лишним людей в чате Twitch начали нервничать. Другие, особенно те, кто смотрел трансляцию больше нескольких минут, были менее обеспокоены.
«Ребята, расслабьтесь», — написал один человек в чате. «До того, как мы выходили и заходили в лабораторию Оука раз 10, прежде чем поняли, как двигаться дальше».

Для давних пользователей Twitch формат трансляции Anthropic может показаться ностальгическим. Более десяти лет назад миллионы людей одновременно пытались сыграть в Pokémon Red в первом в своем роде онлайн-социальном эксперименте под названием Twitch Plays Pokémon . Каждый пользователь мог управлять персонажем игрока через чат Twitch, что приводило к предсказуемо хаотичному игровому процессу.
Некоторые исследователи ИИ ссылались на Twitch Plays Pokémon как на источник вдохновения для своей работы. В октябре 2023 года инженер-программист из Сиэтла Питер Уидден опубликовал на YouTube видео, в котором подробно описал, как он обучил алгоритм обучения с подкреплением играть в Pokémon. Его ИИ провел более 50 000 часов, играя в игру, прежде чем научился успешно в ней ориентироваться. Одной из проблем было то, что ИИ предпочитал любоваться пикселизированным пейзажем вместо того, чтобы играть в игру.
«Реконструкции» Twitch Plays Pokémon, такие как Whidden и Anthropic, на основе искусственного интеллекта, развлекательны, но в то же время немного горько-сладки. Первоначальный стрим был таким поворотным моментом в истории Twitch, потому что он объединил людей неожиданным образом. Все были в одной команде, работая над целью заставить персонажа игрока прекратить бегать по кругу и фактически пройти игру.
В 2025 году мы, похоже, уже не товарищи по команде, а зрители, наблюдающие, как модель ИИ пытается играть в игру, в которую многие из нас освоились, когда нам было пять лет. Это микрокосм, мотивированный ИИ, более масштабной тенденции: наш опыт в сети переходит от совместных, коллективных занятий к более уединенным.
techcrunch