Upgrade to Pro — share decks privately, control downloads, hide ads and more …

強化学習ハンズオン

 強化学習ハンズオン

More Decks by NearMeの技術発表資料です

Other Decks in Research

Transcript

  1. 0
    強化学習ハンズオン
    2023-02-17 第32回NearMe技術勉強会
    Takuma Kakinoue

    View full-size slide

  2. 1
    強化学習ハンズオン
    ● 今回の目的
    ○ 強化学習をするための環境構築&実行
    ○ サンプルコードの解説
    ● 必要なライブラリ(python 3.7および3.8で動作確認済)
    ○ chainer == 7.7.0
    ○ chainerrl == 0.8.0
    ○ pybullet == 3.0.8
    ○ gym == 0.18.3
    ● サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample
    ● 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2

    View full-size slide

  3. 2
    強化学習ハンズオン
    ● 今回は、サンプルとして四足ロボットの歩行動作の学習を行う
    ● 学習前と学習後の比較
    ○ 86行目(agent.load..)のコメントアウトを外して、挙動を確認

    View full-size slide

  4. 3
    次回予告
    ● 巡回セールスマン問題や配送計画問題を強化学習で解いてみる

    View full-size slide