Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
220
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
【Browser Automation × AI】 Stagehandを試してみよう
nearme_tech
PRO
0
13
AIを用いた PID制御で部屋 の温度制御をしてみた
nearme_tech
PRO
0
38
CopilotKit + AG-UIを学ぶ
nearme_tech
PRO
2
160
Tile38 Overview
nearme_tech
PRO
0
56
Rust 製のコードエディタ “Zed” を使ってみた
nearme_tech
PRO
0
470
実践で使えるtorchのテンソル演算
nearme_tech
PRO
0
32
ローカルLLMを⽤いてコード補完を⾏う VSCode拡張機能を作ってみた
nearme_tech
PRO
0
550
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
50
ローカルLLM
nearme_tech
PRO
0
87
Other Decks in Research
See All in Research
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1.7k
2026 東京科学大 情報通信系 研究室紹介 (すずかけ台)
icttitech
0
710
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
490
ForestCast: Forecasting Deforestation Risk at Scale with Deep Learning
satai
3
520
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
990
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
130
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
690
さまざまなAgent FrameworkとAIエージェントの評価
ymd65536
1
450
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
6
4k
20年前に50代だった人たちの今
hysmrk
0
160
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
180
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
190
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.5k
How to Think Like a Performance Engineer
csswizardry
28
2.5k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.4k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
210
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
670
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
140
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.7k
Paper Plane
katiecoart
PRO
0
48k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
200
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
320
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.2k
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you