$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
210
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
ローカルLLMを⽤いてコード補完を⾏う VSCode拡張機能を作ってみた
nearme_tech
PRO
0
70
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
18
ローカルLLM
nearme_tech
PRO
0
32
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
18
Box-Muller法
nearme_tech
PRO
1
32
Kiro触ってみた
nearme_tech
PRO
0
240
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
510
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
120
強化学習アルゴリズムPPOの改善案を考えてみた
nearme_tech
PRO
0
77
Other Decks in Research
See All in Research
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
400
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation
satai
4
480
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
320
財務諸表監査のための逐次検定
masakat0
0
210
機械学習と数理最適化の融合 (MOAI) による革新
mickey_kubo
1
430
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
14
14k
LLM-jp-3 and beyond: Training Large Language Models
odashi
1
690
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
440
Stealing LUKS Keys via TPM and UUID Spoofing in 10 Minutes - BSides 2025
anykeyshik
0
170
教師あり学習と強化学習で作る 最強の数学特化LLM
analokmaus
2
700
MIRU2025 チュートリアル講演「ロボット基盤モデルの最前線」
haraduka
15
11k
単施設でできる臨床研究の考え方
shuntaros
0
3.3k
Featured
See All Featured
The World Runs on Bad Software
bkeepers
PRO
72
12k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
The Language of Interfaces
destraynor
162
25k
Docker and Python
trallard
47
3.7k
GitHub's CSS Performance
jonrohan
1032
470k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Documentation Writing (for coders)
carmenintech
76
5.2k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
720
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you