Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
NearMeの技術発表資料です
PRO
February 17, 2023
Research
0
110
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
2つの曲線を比較する方法ってあるの? 〜フレシェ距離を試してみた〜 with Python
nearme_tech
PRO
1
18
Constrained K-means Clustering (クラスタサイズの制限をしたK-means法) を調べてみた
nearme_tech
PRO
0
16
VRPの近傍操作SWAP*について調べてみた
nearme_tech
PRO
1
49
新人エンジニアが読んでためになった本
nearme_tech
PRO
2
21
Object–relational mapping and query builder battle 1: Intro to Prisma
nearme_tech
PRO
1
29
深層学習モデルの最適化 -Deep Learning Tuning Playbookを読む-
nearme_tech
PRO
1
52
機械学習を支える連続最適化
nearme_tech
PRO
1
44
サードパーティクッキーの終焉と Topics APIによる代替の可能性
nearme_tech
PRO
1
81
ONNXハンズオン
nearme_tech
PRO
2
28
Other Decks in Research
See All in Research
WikipediaやYouTubeにおける論文参照 / joss2024
corgies
1
210
訓練データ作成のためのCloudCompareを利用した点群の手動ラベリング
kentaitakura
0
920
SSII2024 [TS3] 画像認識におけるマルチモーダル基盤モデル ~基盤モデル、あなたのタスクに役立つかも?~
ssii
PRO
0
810
SSII2024 [TS2] 深層学習に潜むバイアス
ssii
PRO
0
520
大規模言語モデル (LLM) の技術と最新動向
ikuyamada
30
15k
機械学習を用いたポケモン対戦選出予測
fufufukakaka
1
560
The past, present, and future of local-first
ept
0
390
生成AIエージェントの現状を俯瞰する
isidaitc
0
2.4k
20240710_熊本県議会・熊本市議会_都市交通勉強会
trafficbrain
0
560
出生抑制策と少子化
morimasao16
0
280
SSII2024 [OS2] 大規模言語モデルと基盤モデルの射程
ssii
PRO
0
380
インタビューだけじゃない!ユーザーに共感しユーザーの目👀を手に入れるためのインプット
moco1013
0
430
Featured
See All Featured
Product Roadmaps are Hard
iamctodd
PRO
48
10k
Testing 201, or: Great Expectations
jmmastey
33
6.9k
Designing for humans not robots
tammielis
247
25k
Build The Right Thing And Hit Your Dates
maggiecrowley
28
2.2k
Fontdeck: Realign not Redesign
paulrobertlloyd
79
5.1k
Learning to Love Humans: Emotional Interface Design
aarron
269
39k
GraphQLとの向き合い方2022年版
quramy
36
13k
Optimising Largest Contentful Paint
csswizardry
18
2.6k
Building a Scalable Design System with Sketch
lauravandoore
458
32k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
26
1.8k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
226
52k
10 Git Anti Patterns You Should be Aware of
lemiorhan
652
58k
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you