Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
210
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
ローカルLLM
nearme_tech
PRO
0
3
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
6
Box-Muller法
nearme_tech
PRO
1
18
Kiro触ってみた
nearme_tech
PRO
0
74
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
410
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
100
強化学習アルゴリズムPPOの改善案を考えてみた
nearme_tech
PRO
0
39
Apple Containerについて調べて触ってみた
nearme_tech
PRO
0
500
Rust 並列強化学習
nearme_tech
PRO
0
34
Other Decks in Research
See All in Research
論文紹介:Safety Alignment Should be Made More Than Just a Few Tokens Deep
kazutoshishinoda
0
110
大学見本市2025 JSTさきがけ事業セミナー「顔の見えないセンシング技術:多様なセンサにもとづく個人情報に配慮した人物状態推定」
miso2024
0
170
音声感情認識技術の進展と展望
nagase
0
320
AIグラフィックデザインの進化:断片から統合(One Piece)へ / From Fragment to One Piece: A Survey on AI-Driven Graphic Design
shunk031
0
530
AWSで実現した大規模日本語VLM学習用データセット "MOMIJI" 構築パイプライン/buiding-momiji
studio_graph
2
830
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
63
33k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
0
220
一人称視点映像解析の最先端(MIRU2025 チュートリアル)
takumayagi
6
4k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
860
CoRL2025速報
rpc
1
2.7k
心理言語学の視点から再考する言語モデルの学習過程
chemical_tree
2
670
Pythonでジオを使い倒そう! 〜それとFOSS4G Hiroshima 2026のご紹介を少し〜
wata909
0
1.1k
Featured
See All Featured
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Git: the NoSQL Database
bkeepers
PRO
431
66k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.7k
It's Worth the Effort
3n
187
28k
BBQ
matthewcrist
89
9.9k
Done Done
chrislema
186
16k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
36
6.1k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
658
61k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Unsuck your backbone
ammeep
671
58k
Speed Design
sergeychernyshev
32
1.2k
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you