Slide 8
Slide 8 text
Horizonのドキュメントをできる限り読み解く
- ReadMe編
- OverView
- HorizonはモデリングとトレーニングにはPyTorchを、servingにはCaffe2を使用。
Horizonは一般的なRLアルゴリズムを学習するためのワークフローが含まれている。デ
ータの前処理、機能の変換、分散トレーニング、反事実的なポリシー評価、および最適
化されたサービス。
- Algorithms Supported
- Discrete-Action DQN
- Parametric-Action DQN
- Double DQN, Dueling DQN, Dueling Double DQN
- DDPG (DDPG)
- Soft Actor-Critic (SAC)