Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepRacerでまなぶ強化学習
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
tandfy
May 16, 2019
Technology
1
1.5k
DeepRacerでまなぶ強化学習
DeepRacerから強化学習へのとっかかりとして数式を使わず強化学習とDeepRacerとの関連についてまとめてみた内容です。
tandfy
May 16, 2019
Tweet
Share
More Decks by tandfy
See All by tandfy
アプリから集まるイベントデータのリアルタイム処理入門
tandfy
0
1.6k
Amazon SageMakerの最新アップデートの紹介
tandfy
1
920
Amazon Personalizeではじめるレコメンドサービス
tandfy
0
1.2k
DeepRacerで学ぶ機械学習 1.1
tandfy
0
1k
DeepRacerで始める機械学習
tandfy
1
1.7k
Amazon SageMakerではじめる物体検出
tandfy
1
1.1k
Other Decks in Technology
See All in Technology
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
100
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
770
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
AWS Network Firewall Proxyを触ってみた
nagisa53
1
240
猫でもわかるKiro CLI(セキュリティ編)
kentapapa
0
100
Webhook best practices for rock solid and resilient deployments
glaforge
2
310
Oracle AI Database移行・アップグレード勉強会 - RAT活用編
oracle4engineer
PRO
0
110
22nd ACRi Webinar - NTT Kawahara-san's slide
nao_sumikawa
0
100
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
210
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
4
1.4k
Exadata Fleet Update
oracle4engineer
PRO
0
1.1k
コスト削減から「セキュリティと利便性」を担うプラットフォームへ
sansantech
PRO
3
1.6k
Featured
See All Featured
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
230
KATA
mclloyd
PRO
34
15k
WENDY [Excerpt]
tessaabrams
9
36k
Marketing to machines
jonoalderson
1
4.6k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.9k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
190
Deep Space Network (abreviated)
tonyrice
0
64
The Invisible Side of Design
smashingmag
302
51k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
140
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
170
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
Transcript
%FFQ3BDFSಉձ ୈೋճΦϑϥΠϯษڧձ!େࡕ େᖒ༐ే "84%FFQ3BDFSͰ·ͳͿڧԽֶश
ࣗݾհ େᖒ༐ే w σʔλΠϯςάϨʔγϣϯ෦ػցֶशνʔϜ w ΤϯδχΞ w ݄ೖࣾ
w લ৬ɿ6OJUZͱ͔1)1ͰήʔϜ։ൃ
ࠓ͢༰ %FFQ3BDFSͰΘΕ͍ͯΔڧԽֶशͷೖ wػցֶश wڧԽֶश wํࡦϕʔεͱՁϕʔεɺ"DUPS$SJUJDɺ110 w%FFQ3BDFS w֤ϋΠύʔύϥϝʔλͷҙຯ
ࠓ͞ͳ͍༰ wࣜ wใुઃܭΛ۩ମతʹͲ͏͢Ε͍͍ͷ͔ wϋΠύʔύϥϝʔλʔ۩ମతʹͲ͏ઃఆͨ͠Β͍͍ͷ͔
ػցֶश
ػցֶश ֓ཁ ͬ͘͟Γݴ͏ͱنଇੑΛֶशͤ͞Δ͜ͱɻ wڭࢣ͋Γֶश͑Λ༩͑ͯೖྗͱ͑ͷنଇੑΛֶशͤ͞Δ wڭࢣͳֶ͠शɿ͑Λ༩͑ͣʹೖྗͷنଇੑΛֶशͤ͞Δ wڭࢣ͋Γֶशɿجຊతʹ͑Λ༩͑ͣʹೖྗͷنଇੑΛֶशͤ͞ Δ͕ɺ෦తʹ͑Λ༩͑ͯิॿ͢Δ wڧԽֶशɿ͋ΔڥͰใु͕࠷େԽ͢ΔߦಈબͷنଇੑΛֶशͤ͞Δ
ͳͲ
ػցֶश χϡʔϥϧωοτϫʔΫ֓ཁ ϑΟʔυϑΥϫʔυ χϡʔϥϧωοτϫʔΫ wೖྗ wόονσʔληοτ͔ΒϥϯμϜʹநग़ wΤϙοΫಉ͡σʔληοτΛ͏ճ wग़ྗ
wೖྗ͕//Λ௨ͬͯग़͖ͯͨͷ wྫ dͷ࣮ͳͲ
ڧԽֶश
ڧԽֶश ֓ཁ ڥ͔ΒΤʔδΣϯτʹঢ়ଶ ΤʔδΣϯτ͕ঢ়ଶʹج͍ͮͯ ߦಈ
ڥ͕ߦಈ݁Ռʹج͍ͮͨใु ΛΤʔδΣϯτ dΛ܁Γฦ͢ ࠷େใु͕Β͑ΔߦಈΛબͿΑ͏ʹֶश͢Δ
ڧԽֶश "84%FFQ3BDFS֓ཁ RoboMakerͰͷγϛϡϨʔγϣϯͱ SageMakerͰͷϞσϧͷֶशΛ܁Γฦ͢
ڧԽֶश %FFQ3BDFS༻ޠ ΤʔδΣϯτɿ%FFQ3BDFS ं ঢ়ଶɿ%FFQ3BDFSͷΧϝϥ͔Βͷը૾ ߦಈɿεςΞϦϯάͱͷΈ߹Θͤ
ڧԽֶश ख๏հ ڧԽֶशͷख๏͍Ζ͍Ζ͋ΔͷͰߜͬͯհ w֤ख๏ͷجຊͱͳΔߟ͑ํɺՁϕʔεͱํࡦϕʔε wݸਓతʹཧղʹۤ࿑ͨ͠"DUPS$SJUJD w%FFQ3BDFSͰΘΕ͍ͯΔ1SPYJNBM1PMJDZ0QUJNJ[BUJPO
ڧԽֶश ख๏հ Ձϕʔε wֶश୳ࡧΛਐΊΔதͰɺ֤ঢ়ଶͱߦಈͷՁΛٻΊ ͍ͯ͘ wݱࡏͷঢ়ଶʹ͓͍ͯՁ͕ߴ͍ߦಈ΄ͲબΕ͍͢ wঢ়ଶͱߦಈͷՁ2 T
B ࣍εςοϓҎ߱ಘΒΕΔใ ुͷ૯ͷظ
ڧԽֶश ख๏հ ํࡦϕʔε wؔ ํࡦؔ ΛٻΊͯɺͦͷؔΛ༻͍ͯ ߦಈΛબͿ wํࡦؔঢ়ଶʹదͨ͠ߦಈ
ͷ֬ Λग़ྗ ͢Δ
ڧԽֶश ख๏հ "DUPS$SJUJD w֤ΞϧΰϦζϜͰঢ়ଶՁͱͯ͠ใुͷฏۉΛ͍ͬͯ ͨͱ͜ΖΛՁؔͰஔ͖͑Δ wՁؔͱํࡦؔڞʹֶशͤ͞Δ
ڧԽֶश ख๏հ $MJQQFE 1SPYJNBM1PMJDZ0QUJNJ[BUJPO w%FFQ3BDFSͷֶशʹΘΕͯΔ wํࡦϕʔε wߋ৽લޙͷํࡦ ߦಈͷ֬
ͷൺΛݩʹֶश͢Δ wߋ৽ྔ͕େ͖͘ͳΓ͗͢ͳ͍Α͏ʹ্ݶͱԼݶΛܾΊͯ$MJQ͢Δ
ڧԽֶश ख๏հ 1SPYJNBM1PMJDZ0QUJNJ[BUJPO https://nervanasystems.github.io/coach/components/agents/policy_optimization/ppo.html
AWS DeepRacer
"84%FFQ3BDFS RoboMakerͰͷγϛϡϨʔγϣϯͱ SageMakerͰͷϞσϧͷֶशΛ܁Γฦ͢
"84%FFQ3BDFS ߦಈۭؒ wͱਐߦํͷΈ߹Θͤ Έ߹Θ͕ͤଟ͍ͱ ಈ͖͕ॊೈʹͳΔ ҙਤͨ͠௨Γಈ͘Α͏ʹ ֶशͤ͞Δͷ͍͠
"84%FFQ3BDFS ใुؔ wҐஔͳͲͷσʔλʹج͍ͮͯใुΛ༩ ͑Δ w1ZUIPOͰࣗ༝ʹॻ͚Δ wෛͷՄ wֶश࣌ʹઌͷεςοϓͷใुߟྀ͞ΕΔ ͜ͱʹཹҙ
DeepRacerʹͲ͏ಈ͍ͯ΄͍͔͠ ใुͱ͍͏ܗͰ ఆٛ͢Δ
"84%FFQ3BDFS ϋΠύʔύϥϝʔλ wόοναΠζҰճͷֶशʹ༻͢Δσʔλ ͷ wΤϙοΫֶशϑΣΠζͰͷֶशճ wֶशϞσϧߋ৽࣌ͷޯͷ ֶश͠ ͢͞
wΤϯτϩϐʔߦಈબ࣌ͷϥϯμϜ͞
"84%FFQ3BDFS ϋΠύʔύϥϝʔλ wׂҾઌͷεςοϓΛͲΕ͚ͩॏࢹ͢Δ͔ ઌͷ εςοϓͰͷใुʹର͢Δ wଛࣦλΠϓՁؔͷϞσϧͷଛࣦؔΛͲ͏͢ Δ͔
wγϛϡϨʔγϣϯϑΣΠζͷΤϐιʔυ
·ͱΊ wڧԽֶशͰχϡʔϥϧωοτϫʔΫ // ΛͬͯΔͷ͕ଟ͍ͷͰɺ·ͣ//ͰͷճؼͳͲڭࢣ͋ Γֶश͔Β࢝ΊΔͷҰͭͷख wڧԽֶशͷख๏͍Ζ͍Ζ͋Δ͚ͲɺํࡦϕʔεͱՁϕʔε͕جຊ w%FFQ3BDFSใु͕ؔॏཁ wใुؔओʹͲ͏͍͏ಈ͖Λֶश͍͔ͤͨ͞Ͱฦ͢ใुͷΛܾΊΔ
wجຊతʹରεςοϓͰͷใु͚ͩͰͳ͘ɺকདྷͷεςοϓͰͷใुؚΊͯධՁ͞ΕΔ wϋΠύʔύϥϝʔλֶशͷํͷௐʹ͏ͷ͕ྑ͛͞ wใुϋΠύʔύϥϝʔλͷ֤͕Ͳ͏ֶशʹ׆͔͞ΕΔ͔ͱ͍͏ͱ͜Ζ͔ΒڧԽֶशʹೖΔͷ͕Φε εϝ ڵຯΛ࣋ͬͨํͥͻ͍Ζ͍ΖάάͬͯΈ͍ͯͩ͘͞ʔ ͦͯ͠ɺҰॹʹۤ͠Έͳ͕Βֶͼ·͠ΐʔ