0強化学習ハンズオン2023-02-17 第32回NearMe技術勉強会Takuma Kakinoue
View Slide
1強化学習ハンズオン● 今回の目的○ 強化学習をするための環境構築&実行○ サンプルコードの解説● 必要なライブラリ(python 3.7および3.8で動作確認済)○ chainer == 7.7.0○ chainerrl == 0.8.0○ pybullet == 3.0.8○ gym == 0.18.3● サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample● 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2強化学習ハンズオン● 今回は、サンプルとして四足ロボットの歩行動作の学習を行う● 学習前と学習後の比較○ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3次回予告● 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4Thank you