В Калифорнии снова решили провести тест при помощи искусственного интеллекта. На этот раз проверить возможности ИИ на классике - платформер Nintendo Super Mario Bros. Сама же игра оказалась весьма неприступной для "робота".
В эксперименте применялась эмуляторная версия игры, интегрированная с разработанной командой Hao AI Lab платформой GamingAgent.
Об этом стало известно благодаря сообщению на портале TechSpot.
Эта система позволяла моделям управлять Марио путем генерации кода Python. Все искусственные интеллекты получали одинаковые базовые инструкции, например, "Перепрыгни этого врага", а также визуальные снимки игрового процесса.
Без документов под арест: ТЦК готовят масштабные проверки украинцев
Отсрочки аннулируют автоматически: кому работа на критических предприятиях больше не гарантирует защиты от мобилизации
ЕС отменяет штампы в паспортах: как изменятся правила выезда за границу для украинцев
ПриватБанк блокирует карты за снятие наличных: проблемно получить даже 500 грн
Хотя Super Mario Bros. на первый взгляд кажется простой 2D-игрой, она оказалась серьезным вызовом для ИИ. Моделям приходилось не только строить сложные последовательности движений, но и быстро адаптировать стратегию прохождения в реальном времени.
Лучшие результаты продемонстрировал Claude 3.7 от Anthropic – он отличился точными прыжками и умением избегать врагов. Его предшественник, Claude 3.5, также показал достойный результат, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google несколько отставали.
Исследование показало, что для успешного прохождения Super Mario Bros. логическое мышление играет второстепенную роль, зато решающее значение имеет точность и скорость реакции. Даже небольшая задержка могла отправить Марио на предыдущий чекпойнт.
По мнению исследователей, более "обдуманные" модели тратили слишком много времени на расчеты следующего шага, что приводило к частым неудачам.
Исследователи подчеркивают, что использование ретроигр для оценки ИИ – это преимущественно экспериментальный подход. Умение пройти Super Mario Bros. не определяет реальную полезность модели, но наблюдать, как интеллекты, обученные на миллиардах параметров, терпят поражение в классической игре, безусловно, интересно.
Напомним, открытый мир, боевая механика и свежий сюжет: Sony раскрыла новые детали Death Stranding 2.
Ранее сообщалось, For Honor живее всех живых: Ubisoft запускает 9-й год с новыми героями и режимами.
Также, критический баг поставил агрессивную демократию Helldivers 2 на паузу: что предлагают игрокам.