Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
220
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
ローカルLLMを⽤いてコード補完を⾏う VSCode拡張機能を作ってみた
nearme_tech
PRO
0
120
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
21
ローカルLLM
nearme_tech
PRO
0
37
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
22
Box-Muller法
nearme_tech
PRO
1
36
Kiro触ってみた
nearme_tech
PRO
0
280
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
540
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
130
強化学習アルゴリズムPPOの改善案を考えてみた
nearme_tech
PRO
0
83
Other Decks in Research
See All in Research
Nullspace MPC
mizuhoaoki
1
510
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
210
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
110
AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data
satai
3
550
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
340
Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification
satai
3
310
MIRU2025 チュートリアル講演「ロボット基盤モデルの最前線」
haraduka
15
11k
論文紹介:Safety Alignment Should be Made More Than Just a Few Tokens Deep
kazutoshishinoda
0
150
SNLP2025:Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
220
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
0
110
自動運転におけるデータ駆動型AIに対する安全性の考え方 / Safety Engineering for Data-Driven AI in Autonomous Driving Systems
ishikawafyu
0
110
HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery
satai
3
340
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
170
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
0
270
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Information Architects: The Missing Link in Design Systems
soysaucechin
0
700
Code Reviewing Like a Champion
maltzj
527
40k
Amusing Abliteration
ianozsvald
0
63
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
110
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
20
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
110
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
0
1.7k
My Coaching Mixtape
mlcsv
0
7
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you