DeepRacer DeepDive

Naoki Jogan 1 Classmethod, Inc. AWS Business Unit Consulting Dev.
2018/12/5 %FFQ3BDFS%FFQ %JWF re:Growth 2018

ࣗݾ঺հ • ιϦϡʔγϣϯΞʔΩςΫτ • ೥݄ೖࣾ ೥ؒ4*FSͰ"1ΤϯδχΞ • ࠷ۙ͞Θ͍ͬͯΔαʔϏε &,4
4VNFSJBO ৓؛௚رʢδϣ΢ΨϯφΦΩʣ "84ࣄۀຊ෦ίϯαϧςΟϯά෦

re:Invent 2018 KeyNote

ࠓ೔࿩͢͜ͱ w%FFQ3BDFSͰԿ͕Ͱ͖Δͷ͔ɹʙNJO w%FFQ3BDFSΛͲ͏΍ͬͯಈ͔͢ͷ͔ɹʙNJO w%FFQ3BDFS͸Ͳ͏΍ֶͬͯΜͰ͍Δͷ͔ɹʙNJO

%FFQ3BDFSͰԿ͕Ͱ͖Δͷʁ 5

%FFQ3BDFSͰԿ͕Ͱ͖Δͷʁ ڧԽֶशΛֶ΂Δ

%FFQ3BDFS஀ੜͷഎܠ How can we put Reinforcement Learning in the
hands of all developers?

%FFQ3BDFS͸ڧԽֶशΛֶͿͨΊͷखஈ wڧԽֶशΛ։ൃऀͷखʹ౉͢ ΤΩαΠςΟϯάͳखஈ wڧԽֶशͷϋϯζΦϯΛఏڙ

ڧԽֶशͱ͸ʁ

ػցֶशͷछྨ UCL Course on RL Lecture 1: ntroduction to
Reinforcement Learning wڭࢣ͋Γֶश wڭࢣͳֶ͠श wڧԽֶशʢ%FFQ3BDFSʣ

ࣗಈӡస

ғޟকع

ڧԽֶशͬͯͲ͏΍Δͷʁ

ڧԽֶशʢྫʣ ใु RLΞϧΰϦζϜ wΤαΛͨ͘͞Μ৯΂ͯ wఢ͕͍ͳ͍ͱ͜ΖʹਐΜͰ wγϛϡϨʔγϣϯ wใुΛ࠷େԽ

%FFQ3BDFSΛಈ͔ͯ͠ΈΔ 15

%FFQ3BDFSΛಈ͔͢·Ͱ wεςοϓ̍ɿ3FXBSEؔ਺࡞੒ wεςοϓ̎ɿγϛϡϨʔγϣϯ wεςοϓ̏ɿ෺ཧͰ૸ΒͤΔ

εςοϓ̍ɿ3FXBSEؔ਺ ใुؔ਺ʢPythonʣ ɾEJTUBODF@GSPN@DFOUFS ɹηϯλʔϥΠϯ͔Βͷڑ཭ ɾPO@USBDL ɹं྆ͷલ෦͕നઢͷ֎ଆʹ͋Δ͔Ͳ͏͔ ɾUISPUUMF ɹंͷ଎౓ɹ͸ఀࢭΛࣔ͠ɺ͸࠷ߴ଎౓ ɾUSBDL@XJEUI
ɹτϥοΫ෯ ɹ ɹͳͲͳͲ Πϯϓοτ Ξ΢τϓοτ

εςοϓ̍ɿ3FXBSEؔ਺ NBSLFS@ USBDL@XJEUI NBSLFS@ USBDL@XJEUI NBSLFS@ USBDL@XJEUI SFXBSEF JGEJTUBODF@GSPN@DFOUFSBOEEJTUBODF@GSPN@DFOUFSNBSLFS@
SFXBSE FMJGEJTUBODF@GSPN@DFOUFSNBSLFS@ SFXBSE FMJGEJTUBODF@GSPN@DFOUFSNBSLFS@ SFXBSE FMTF SFXBSEFMJLFMZDSBTIFEDMPTFUPPGGUSBDL

εςοϓ̎ɿϞσϧ࡞੒

εςοϓ̏ɿ෺ཧͰ૸ΒͤΔ ֶशϞσϧ

εςοϓ̏ɿ෺ཧͰ૸ΒͤΔ

"84্ͷΞʔΩςΫνϟ SageMaker RoboMaker S3 kinesis video streams CloudWatch Logs
Client

%FFQ3BDFS͸Ͳ͏΍ֶͬͯΜͰ͍Δͷ͔ 27

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ https://www.slideshare.net/AmazonWebServices/robocar-rally-2018-aim206r20-aws-reinvent-2018 ɾ45"5&ɿঢ়ଶ ɹ%FFQ3BDFSͷϑϩϯτΧϝϥ ɾ3&8"3%ɿใु ɹηϯλʔϥΠϯʹ͚ۙΕ͹(PPE ɹεϐʔυ͕ग़͍ͯΕ͹(PPE ɾ"$5*0/ɿߦಈ ɹεϐʔυΛ্͛Δ
ɹӈʹۂ͕Δɺࠨʹۂ͕Δ

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ "$5*0/ ɾεϐʔυΛ্͛Δ ɾ௚ਐ͢Δ ɾӈʹۂ͕Δ ɾࠨʹۂ͕Δ t=0 S0

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ t=1 S "$5*0/ ɾεϐʔυΛ্͛Δ ɾ௚ਐ͢Δ ɾӈʹۂ͕Δ ɾࠨʹۂ͕Δ 1

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ t=1 S "$5*0/ ɾεϐʔυΛ্͛Δ ɾ௚ਐ͢Δ ɾӈʹۂ͕Δ ɾࠨʹۂ͕Δ R
:ಓ֎ΕͨͷͰใुͳ͠ 1

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ "$5*0/ ɾεϐʔυΛ্͛Δ ɾ௚ਐ͢Δ ɾӈʹۂ͕Δ ɾࠨʹۂ͕Δ t=0 S0

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ t=1 S "$5*0/ ɾεϐʔυΛ্͛Δ ɾ௚ਐ͢Δ ɾӈʹۂ͕Δ ɾࠨʹۂ͕Δ 1

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ t=1 S "$5*0/ ɾεϐʔυΛ্͛Δ ɾ௚ਐ͢Δ ɾӈʹۂ͕Δ ɾࠨʹۂ͕Δ R
:ঢ়گʹԠͨ͡ใु 1

τϨʔχϯά͸ͲͷΑ͏ʹͯ͠ߦΘΕΔ͔ʁ https://www.slideshare.net/AmazonWebServices/robocar-rally-2018-aim206r20-aws-reinvent-2018

·ͱΊ 38

·ͱΊ w%FFQ3BDFS͸ڧԽֶशΛֶͿͨΊͷखஈ w%FFQ3BDFS͸ڧԽֶशͱ͔ؔ܎ͳ͘୯७ʹָ͍͠ wϨʔεେձ΋͋ΔͷͰΈΜͳࢀՃ͠Α͏ʂʂΞϝϦΧͰʁ

40 ԶͰڧԽֶशΛ ֶΜͰ͘Εʂʂ ࠓͳΒˈ249

Let's start reinforcement learning with DeepRacer

DeepRacer DeepDive

DeepRacer DeepDive

More Decks by jogannaoki

Featured

Transcript