Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[論文サーベイ] Survey on GPT for Games

tt1717
November 24, 2024

[論文サーベイ] Survey on GPT for Games

PDFファイルをダウンロードすると,スライド内のリンクを見ることができます.
1.Atari-GPT: Investigating the Capabilities of Multimodal Large Language Models as Low-Level Policies for Atari Games,
Nicholas R. Waytowich et al. (DEVCOM Army Research Laboratory et al.) [arXiv'24] (Cited by: - )
2.MarioGPT: Open-Ended Text2Level Generation through Large Language Models,
Shyam Sudhakaran et al. (IT University of Copenhagen et al.) [NeurIPS'23] (Cited by:56)
3.Will GPT-4 Run DOOM?,
Adrian de Wynter. (The University of York.) [arXiv'24] (Cited by:3)

tt1717

November 24, 2024
Tweet

More Decks by tt1717

Other Decks in Research

Transcript

  1. Survey on GPT for Games Atari-GPT: Investigating the Capabilities of

    Multimodal Large Language Models as Low-Level Policies for Atari Games, Nicholas R. Waytowich et al. (DEVCOM Army Research Laboratory et al.) [arXiv'24] (Cited by: - ) 1/30 2024/10/02 MarioGPT: Open-Ended Text2Level Generation through Large Language Models, Shyam Sudhakaran et al. (IT University of Copenhagen et al.) [NeurIPS'23] (Cited by:56) Will GPT-4 Run DOOM?, Adrian de Wynter. (The University of York.) [arXiv'24] (Cited by:3)
  2. 2/30 GPT for Games | 背景 ❖ ゲーム内コンテンツの自動生成 ➢ GPTを使ってゲームのストーリー,レベル,キャラクターなどを自動生成

    ➢ e.g.) MarioGPT ❖ ゲームデザイン・開発のアシスト ➢ ゲームを作るプロセスでGPTがサポート ❖ ゲームプレイ中のサポート ➢ 完成したゲームを遊ぶ際にGPTがサポート ❖ GPTがゲームをプレイ ➢ GPTが自らゲームをプレイしたり,対戦相手になる ➢ e.g.) Atari-GPT, GPT-4 DOOM ❖ ゲームユーザー調査 ➢ ゲームレビューやコメントを分析して,ユーザーの体験を理解 サーベイ論文:GPT for Games: A Scoping Review (2020-2023)
  3. 3/30 ❖ GPTモデルのトレンド ➢ ChatGPTの登場で,2023年の 関連研究が大幅に増加 ➢ ChatGPTが登場し,ゲーム開 発や新たな活用方法が拡大 GPT

    for Games | 背景 ❖ GPT活用領域のトレンド ➢ コンテンツの自動生成が最も活発 ➢ GPTモデル活用により,ゲーム開 発が効率化 サーベイ論文:GPT for Games: A Scoping Review (2020-2023)
  4. 11/30 ❖ In-Context Learningの出力例 Atari-GPT | 実験結果 Third frame |

    ”推論”:現在のフレームでは,ボールは右のパドルとほぼ一直線上にあるが,わ ずかに下に位置している.ボールを打ち返すためには,右パドルは近づいてくるボールと一直線 に並んでいる必要がある.最適な行動は少し下(左)に行くことである. “行動”:3
  5. ❖ Prompt ➢ 生成するマリオのレベルに関する条件や特徴を指示するためのテキスト ❖ Frozen Text Encoder ➢ プロンプトをトークン

    (単語や数字) に分解 ➢ パラメータを固定 (Frozen) することで,一貫性のあるトークン化を実現 16/30 MarioGPT | 手法
  6. ❖ Initial Tokenized level ➢ タイルやオブジェクトが数値に対応しており,ステージ全体をトークン化 ❖ GPT Layers ➢

    生成されたトークンを参照し,次のトークンを予測 ➢ これにより,タイルやオブジェクトをステージに追加 17/30 MarioGPT | 手法
  7. ❖ Cross attention ➢ プロンプトのテキスト情報とInitial Tokenized level情報のアテンションを計算 ➢ プロンプトの内容に沿ったステージ生成が可能 ❖

    Prediction ➢ Cross Attentionの結果をもとに次のトークンを予測してステージに追加 18/30 MarioGPT | 手法
  8. ❖ Visionの出力例 (抜粋) ➢ プレイヤーは緑色の床とメタ リックな質感の茶色の壁の部屋 にいるようだ.床には有毒と思 われる緑色の液体が溜まってい る.遠くに悪魔のような赤い敵 がいる.

    ➢ 左側には現在の武器の弾薬数が 「51」と表示されている. ➢ 中央には「100%」と表示され たヘルスインジケータがある. ➢ 右側にはアーマーのパーセン テージが「4%」と表示されてい る. 27/30 Will GPT-4 Run DOOM? | 実験結果
  9. Atari-GPT: AtariタスクにVLMによる方策エージェントを適用した手法 29/30 MarioGPT: マリオタスクを対象に新たなステージ生成手法を提案 ❖ 傾向と今後 ➢ コンテンツの自動生成による研究が増える予感 ➢

    別のゲーム環境において同様の研究が実施されそう Will GPT-4 Run DOOM?: DoomタスクにVLMによる方策エージェントを適用した手法 まとめ