Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
200
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
2
150
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
76
強化学習アルゴリズムPPOの改善案を考えてみた
nearme_tech
PRO
0
6
Apple Containerについて調べて触ってみた
nearme_tech
PRO
0
120
Rust 並列強化学習
nearme_tech
PRO
0
23
並列で⽣成AIにコーディングをやらせる
nearme_tech
PRO
1
150
希望休勤務を考慮したシフト作成
nearme_tech
PRO
0
39
Hub Labeling による高速経路探索
nearme_tech
PRO
0
100
Build an AI agent with Mastra
nearme_tech
PRO
0
82
Other Decks in Research
See All in Research
[論文紹介] Intuitive Fine-Tuning
ryou0634
0
110
機械学習と数理最適化の融合 (MOAI) による革新
mickey_kubo
0
310
[CV勉強会@関東 CVPR2025] VLM自動運転model S4-Driver
shinkyoto
2
480
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
180
Type Theory as a Formal Basis of Natural Language Semantics
daikimatsuoka
1
290
Time to Cash: The Full Stack Breakdown of Modern ATM Attacks
ratatata
0
120
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
980
AWSで実現した大規模日本語VLM学習用データセット "MOMIJI" 構築パイプライン/buiding-momiji
studio_graph
2
490
SSII2025 [SS2] 横浜DeNAベイスターズの躍進を支えたAIプロダクト
ssii
PRO
7
4k
大規模な2値整数計画問題に対する 効率的な重み付き局所探索法
mickey_kubo
1
360
EarthSynth: Generating Informative Earth Observation with Diffusion Models
satai
3
250
数理最適化に基づく制御
mickey_kubo
6
730
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
GraphQLの誤解/rethinking-graphql
sonatard
72
11k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Visualization
eitanlees
148
16k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you