TechCrunch 2023/10/19 04:10:17(JST)
10年前、オンライン現象「Twitch Plays Pokémon」が100万人以上の人々を集め、1つのピクセル化されたアバターのコマンドとして各プレイヤーのキーストロークが登録される形でポケモンレッドをプレイしました。今、技術の進化により新たな問いが生まれています。AIはポケモンをプレイできるのでしょうか?
シアトルを拠点とするソフトウェアエンジニアのピーター・ウィデンは、過去数年間にわたり強化学習アルゴリズムを使ってポケモンシリーズの初代ゲームをナビゲートするAIを訓練してきました。このAIはゲームを50,000時間以上プレイしており、その開発の物語を語る33分のYouTube動画を投稿し、9日間で220万回以上の再生回数を記録しました。
AIの強化モデルはパブロフの法則に基づいており、ポケモンのレベルアップ、新しいエリアの探索、バトルの勝利、ジムリーダーの撃破などにポイントベースのインセンティブを与えています。時にはこれらのインセンティブがゲームの進行と完全に一致しないこともありますが、AIの失敗は奇妙に魅力的であり、それがウィデンの動画がバイラルになった理由かもしれません。
”
AIは水のある場所であるパレットタウンでただただ水を見つめるだけで動かず、最初のポケモンさえ手に入れずにその場に立ち往生してしまいます。しかし、このAIは「すべてを捕まえる」ことには急いでいません。カントー地方の美しさを楽しんでいるのか、もしくはこれらの可愛らしい生物を戦わせることに対して倫理的な立場を取っているのかはわかりません。
AIはトラウマのような経験をすることもあります。ポケモンセンターでの出来事がトラウマになり、ポケモンを預けることでレベルの合計が大幅に減少し、AIに強いネガティブなシグナルを送ります。このような一度の出来事でもAIの行動に持続的な影響を与えるのです。
”
AIはトラウマを経験し、パレットタウンの美しいピクセルに感動することができますが、それでもただのコンピュータです。AIはゲーム内の対話を読み取ることができないため、初期のバージョンではゲームの早い段階で行き詰まってしまいました。しかし、ウィデンは進行を不可能にすることなく、パッケージを届けるためにゲームを進めるように調整しました。
”
ウィデンの動画は、ポケモンを通じて理解しにくい概念を分かりやすく説明する能力があるため、他の研究者がゲームでAIを使用することを研究する中で注目を浴びています。
(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:After 50,000 hours, this AI can play Pokémon Red.