Slide 3
Slide 3 text
背景
強化学習(Reinforcement Learning, RL)とは
機械学習の一種で、エージェントが環境に対して試行錯誤しながら、
報酬を最大化するような方策を学習する手法
複数エージェント化
マルチエージェント強化学習
(Multi-Agent Reinforcement Learning, MARL)
• サッカーゲーム
• 交通制御(自動運転車)
• 多関節ロボット
協力タスクに有効
• 長期依存関係の学習
• 動的な環境への適応
TransfQMix
今回使用したアルゴリズム
Transformerを用いており、他のアルゴリズムよりも圧倒的に高性能
時間的に遠い距離にあるトークン同士の関係を上手く学習
環境の変化に応じて重要な情報に焦点を当てるため、非定常な環境で上手く学習
このTransformerの良い性質が高性能化に繋がったと考えられる
https://arxiv.org/ftp/arxiv/papers/2301/2301.05334.pdf
出典:TransfQMix: Transformers for Leveraging the Graph Structure of
Multi-Agent Reinforcement Learning Problems (13 Jan 2023) Figure 3