Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AWS DeepRacerで最適な行動・報酬関数を得る為の試行錯誤

AWS DeepRacerで最適な行動・報酬関数を得る為の試行錯誤

2019/05/16 DeepRacer同好会 第二回オフライン勉強会@大阪 のセッションスライドです。

貞松政史

May 16, 2019
Tweet

More Decks by 貞松政史

Other Decks in Technology

Transcript

  1. 3 ⾃⼰紹介 貞松 政史 (サダマツ マサシ) @sady_nitro データインテグレーション部 (DI部) 開発チーム

    岡⼭オフィス勤務 データ分析基盤開発 某コーヒー関連 SageMaker Lambda ⽒名 所属 近況 好きなAWS サービス
  2. 34 実際にモデルの学習を繰り返してわかったこと London loopをひたすら回した結果 • センターラインにびったり張り付いても速くない • 意外とフルスロットルでいける • 報酬関数は複雑なほど良いわけでは無い

    • 最終的にカリッカリにタイム短縮を狙うならstepsや progressの考慮が必要…︖ • さらにカリッカリにチューニングする場合はハイパーパ ラメータの調整も⼊ってくる…︖