Survey on Minecraft AI in NeurIPS 2024
タイトル 学会 著者/所属 引用数
RL-GPT: Integrating
Reinforcement Learning
and Code-as-policy
NeurIPS'24
[Oral Poster]
Shaoteng Liu et al.
(The Chinese University of Hong Kong et al.)
6
Optimus-1: Hybrid
Multimodal Memory
Empowered Agents Excel
in Long-Horizon Tasks
NeurIPS'24
[Poster]
Zaijing Li et al.
(Harbin Institute of Technology,
Shenzhen et al.)
6
OmniJARVIS: Unified
Vision-Language-Action
Tokenization Enables
Open-World Instruction
Following Agents
NeurIPS'24
[Poster]
Zihao Wang et al.
(Institute for Artificial Intelligence,
Peking University et al.)
-
2025/01/08
1/21
Slide 2
Slide 2 text
● Slow Agentを用いてタスクを高レベルと低レベルに分
解する.
● Fast Agentを用いて「RLによる処理」では行動空間を
設計し,「LLMによる処理」ではコードを生成する.
A. どんなもの?
● 強化学習(RL)と大規模言語モデル(LLM)を統合し
た新しい手法「RL-GPT」を提案
● タスクを「RLによる処理」と「LLMによる処理」に分
解し,サンプル効率の高い仕組みを構築
B. 先行研究と比べてどこがすごい?
● RLとLLMの弱みを相互補完し,サンプル効率の高い学
習を実現.
● Minecraft環境で,従来手法を上回る成功率
D. どうやって有効だと検証した?
● MinecraftベースのMineDojo環境で複数タスクを評価
し,従来手法を上回る成功率を確認.
● 「ダイヤモンド入手」タスクでは,少ないサンプル数
で効率的に学習できることを実証.
E. 手法の概要
C. 技術や手法のキモはどこ?
2/21
RL-GPT: Integrating Reinforcement Learning and Code-as-policy