Slide 15
Slide 15 text
15
Google Research Football with Manchester City F.C.
● サッカー
○ ボールに近い 1 人のみを操作する
○ 各方向の移動、パス、シュート等 19 通りの行動がある
● 1 位解法
○ 強化学習
■ Deheng Ye, et al に近い手法らしい
■ PPO
● 2位強化学習(IMPALA)、3位強化学習(TD(λ),IMPALA,UPGO)、5位強化学習
(TD(λ),UPGO)、6位強化学習(PPO)、7位模倣学習(GBDT)