Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
February 17, 2023
Research
0
90
強化学習ハンズオン
NearMeの技術発表資料です
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
第83回NearMe技術勉強会.pptx.pdf
nearme_tech
0
5
Dynamic Vehicle Routing のシミュレーションを Streamlitで作ってみた
nearme_tech
0
26
ログ監視ツールについて調べてみた
nearme_tech
0
22
(インターン生が大学院で行なっている)研究紹介
nearme_tech
0
13
拡散モデルの概要 −§2. スコアベースモデルについて−
nearme_tech
0
33
jinja2を用いたログファイルの一覧化
nearme_tech
0
31
プログラミング言語を作る
nearme_tech
0
16
Bunファースト開発
nearme_tech
0
22
streamlitを使った数理最適化ダッシュボード
nearme_tech
0
64
Other Decks in Research
See All in Research
Gmail の「メール送信者のガイドライン」強化から 1 ヵ月、今後予想されるメールセキュリティの変化とは
hirachan
1
200
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations
rudorudo11
0
150
プロシェアリング白書2024_PROSHARING_REPORT_2024
circulation
0
450
20240209 データを肴に熊本の交通を考える会「車1割削減、渋滞半減、公共交通2倍」をめざし世界に学ぼう
trafficbrain
0
690
クリック率を最大化しない推薦システム
joisino
41
13k
自己教師あり学習による事前学習(CVIMチュートリアル)
naok615
2
1.2k
近似最近傍探索とVector DBの理論的背景
matsui_528
2
780
CoRL2023速報
rpc
1
1.9k
Breaking Tradeoffs: Extremely Scalable Multi-Agent Pathfinding Algorithms
kei18
0
120
Schrödinger Bridge問題に基づく拡散生成モデル学習
takeshi_koshizuka
1
510
Combating Misinformation in the age of LLMs
teacherpeterpan
0
110
VAR モデルによる OSS プロジェクト同士が生存性に与える 影響の分析
noppoman
0
120
Featured
See All Featured
Building Adaptive Systems
keathley
29
1.8k
Creatively Recalculating Your Daily Design Routine
revolveconf
209
11k
No one is an island. Learnings from fostering a developers community.
thoeni
14
2k
Pencils Down: Stop Designing & Start Developing
hursman
115
11k
What the flash - Photography Introduction
edds
64
11k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
14
1.3k
Web Components: a chance to create the future
zenorocha
304
41k
Typedesign – Prime Four
hannesfritz
36
2k
How STYLIGHT went responsive
nonsquared
92
4.7k
Fantastic passwords and where to find them - at NoRuKo
philnash
35
2.4k
In The Pink: A Labor of Love
frogandcode
137
21k
Art, The Web, and Tiny UX
lynnandtonic
288
19k
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you