Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習ハンズオン
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NearMeの技術発表資料です
PRO
February 17, 2023
Research
230
0
Share
強化学習ハンズオン
NearMeの技術発表資料です
PRO
February 17, 2023
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
実務で役立つ幾何学 ボロノイ図の基礎から グラフ・ネットワーク応用まで
nearme_tech
PRO
0
28
SQL/ID抽出タスクから考える 実践的なハルシネーション対策
nearme_tech
PRO
0
45
OpenCode & Local LLM
nearme_tech
PRO
0
43
OpenCode Introduction
nearme_tech
PRO
0
40
【Browser Automation × AI】 Stagehandを試してみよう
nearme_tech
PRO
0
110
AIを用いた PID制御で部屋 の温度制御をしてみた
nearme_tech
PRO
0
110
CopilotKit + AG-UIを学ぶ
nearme_tech
PRO
3
460
Tile38 Overview
nearme_tech
PRO
0
90
Rust 製のコードエディタ “Zed” を使ってみた
nearme_tech
PRO
1
1.7k
Other Decks in Research
See All in Research
IEEE AIxVR 2026 Keynote Talk: "Beyond Visibility: Understanding Scenes and Humans under Challenging Conditions with Diverse Sensing"
miso2024
0
190
セマンティック通信勉強会 6Gに向けたデバイス間効率的な通信の技術紹介・課題・今後展望
satai
2
120
「AIとWhyを深堀る」をAIと深堀る
iflection
0
420
AIを叩き台として、 「検証」から「共創」へと進化するリサーチ
mela_dayo
0
260
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
250
SoftMatcha 2: 1兆語規模コーパスの超高速かつ柔らかい検索
e869120_sub
6
3.4k
Data Visualization Tools in the Age of AI
flekschas
0
150
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
kogo
0
590
進学校の生徒にはア行の苗字が多いのか
ozekinote
0
410
YOLO26_ Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection
satai
3
710
Apache Gravitinoで実現する Icebergカタログ統合とアクセスの一元化
matsumooon
0
220
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
1.1k
Featured
See All Featured
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Designing Powerful Visuals for Engaging Learning
tmiket
1
380
RailsConf 2023
tenderlove
30
1.4k
Utilizing Notion as your number one productivity tool
mfonobong
4
310
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
750
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
WCS-LA-2024
lcolladotor
0
600
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
360
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
220
The SEO identity crisis: Don't let AI make you average
varn
0
470
Tell your own story through comics
letsgokoyo
1
930
Transcript
0 強化学習ハンズオン 2023-02-17 第32回NearMe技術勉強会 Takuma Kakinoue
1 強化学習ハンズオン • 今回の目的 ◦ 強化学習をするための環境構築&実行 ◦ サンプルコードの解説 • 必要なライブラリ(python
3.7および3.8で動作確認済) ◦ chainer == 7.7.0 ◦ chainerrl == 0.8.0 ◦ pybullet == 3.0.8 ◦ gym == 0.18.3 • サンプルコード → https://github.com/kakky-hacker/rl-bullet-sample • 参考 → https://qiita.com/KProgramed/items/f256bc0d6e5d27224da2
2 強化学習ハンズオン • 今回は、サンプルとして四足ロボットの歩行動作の学習を行う • 学習前と学習後の比較 ◦ 86行目(agent.load..)のコメントアウトを外して、挙動を確認
3 次回予告 • 巡回セールスマン問題や配送計画問題を強化学習で解いてみる
4 Thank you