Upgrade to Pro — share decks privately, control downloads, hide ads and more …

RLSP2021資料

 RLSP2021資料

東京大学松尾研究室が主催する強化学習のセミナーの最終課題発表資料.

Ryunosuke-Ikeda

April 14, 2021
Tweet

More Decks by Ryunosuke-Ikeda

Other Decks in Research

Transcript

  1. 手法 ・実験 εとnを変化させる事で生まれる性能の変化を考察した. 1. ε = 0.0, n = 1

    2. ε = 0.05, n = 1 3. ε = f(step) = 50 / (1000 + step), n = 1 4. ε = 0.0, n = 3 実験1. の結果を基準とする.
  2. 実験結果 実験3 (ε = f(step) = 50 / (1000 +

    step), n = 1)との比較 ・実験3は実験1と同程度 の報酬を獲得.
  3. 参考記事・サイト • Jetson Nanoで動く深層強化学習を使ったラジコン向け自動運転ソフトウェアの 紹介 • Learning_RacerをWaveshare製Jetbotで試した。 • Donkey Carを組み立てる前にシミュレーターで楽しんでみる

    Donkey Car 3.1.0編 • https://towardsdatascience.com/learning-to-drive-smoothly-in-minutes- 450a7cdb35f4 まとめ 私たちは深層強化学習を利用して、シミュレータ環境と実環境の2通りで実験を 行いました。 - 実環境ではロボット本体に組み込むときの動作環境を整えることができず実 験まで行えなかったが、シミュレータ環境では学習を行うことができ、ロボ ットカーでコースを何週も周れることができた。