Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
170
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
ルートの質を評価する指標について
nearme_tech
PRO
0
13
Rustで作る強化学習エージェント
nearme_tech
PRO
0
43
ビームサーチ
nearme_tech
PRO
0
36
WASM入門
nearme_tech
PRO
0
37
ESLintをもっと有効活用しよう
nearme_tech
PRO
0
26
リファクタリングのための第一歩
nearme_tech
PRO
0
69
ガウス過程回帰とベイズ最適化
nearme_tech
PRO
1
200
確率的プログラミング入門
nearme_tech
PRO
2
120
Observability and OpenTelemetry
nearme_tech
PRO
2
46
Other Decks in Research
See All in Research
Tiaccoon: コンテナネットワークにおいて複数トランスポート方式で統一的なアクセス制御
hiroyaonoe
0
450
【NLPコロキウム】Stepwise Alignment for Constrained Language Model Policy Optimization (NeurIPS 2024)
akifumi_wachi
3
540
[輪講] Transformer Layers as Painters
nk35jk
4
700
Human-Informed Machine Learning Models and Interactions
hiromu1996
2
580
Vision Language Modelと完全自動運転AIの最新動向
tsubasashi
0
260
Intrinsic Self-Supervision for Data Quality Audits
fabiangroeger
0
350
LLM 시대의 Compliance: Safety & Security
huffon
0
610
アプリケーションから知るモデルマージ
maguro27
0
270
メールからの名刺情報抽出におけるLLM活用 / Use of LLM in extracting business card information from e-mails
sansan_randd
2
440
The Economics of Platforms 輪読会 第1章
tomonatu8
0
150
o1 pro mode の調査レポート
smorce
0
130
IM2024
mamoruk
0
230
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
693
190k
Visualization
eitanlees
146
15k
The Cult of Friendly URLs
andyhume
78
6.2k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
13
1k
Fontdeck: Realign not Redesign
paulrobertlloyd
83
5.4k
4 Signs Your Business is Dying
shpigford
183
22k
Agile that works and the tools we love
rasmusluckow
328
21k
Done Done
chrislema
182
16k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
Optimising Largest Contentful Paint
csswizardry
34
3.1k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you