Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
220
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
Tile38 Overview
nearme_tech
PRO
0
35
Rust 製のコードエディタ “Zed” を使ってみた
nearme_tech
PRO
0
210
実践で使えるtorchのテンソル演算
nearme_tech
PRO
0
21
ローカルLLMを⽤いてコード補完を⾏う VSCode拡張機能を作ってみた
nearme_tech
PRO
0
440
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
34
ローカルLLM
nearme_tech
PRO
0
55
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
34
Box-Muller法
nearme_tech
PRO
1
55
Kiro触ってみた
nearme_tech
PRO
0
410
Other Decks in Research
See All in Research
データサイエンティストの業務変化
datascientistsociety
PRO
0
220
財務諸表監査のための逐次検定
masakat0
1
250
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
390
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
710
2025-11-21-DA-10th-satellite
yegusa
0
110
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
6
3.2k
HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery
satai
3
620
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
160
Attaques quantiques sur Bitcoin : comment se protéger ?
rlifchitz
0
140
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
160
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
300
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1.2k
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
760
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.3k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
1
57
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
120
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
250
Deep Space Network (abreviated)
tonyrice
0
64
Leo the Paperboy
mayatellez
4
1.4k
Fireside Chat
paigeccino
41
3.8k
[SF Ruby Conf 2025] Rails X
palkan
1
760
ラッコキーワード サービス紹介資料
rakko
1
2.3M
Large-scale JavaScript Application Architecture
addyosmani
515
110k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you