Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

Montezuma’s Revenge Solved by Go-Explore, a Ne...

kzmssk
December 10, 2018

Montezuma’s Revenge Solved by Go-Explore, a New Algorithm for Hard-Exploration Problems 

Dwango Media Villageのエンジニア 佐々木です。
ATARIの難問題「Montezuma’s Revenge」のSOTAを大幅に更新した強化学習の探索手法Go-Exploreを解説します!

kzmssk

December 10, 2018
Tweet

More Decks by kzmssk

Other Decks in Technology

Transcript

  1. %PNBJOͷ஌ࣝΛೖΕͳ͍৔߹ ؍ଌ৘ใΛѹॖͨ͠΋ͷ "5"3*ͷ৔߹͸ը૾Λμ΢ϯαϯϓϦϯάͨ͠΋ͷ %PNBJOͷ஌ࣝΛೖΕΔ৔߹ ؀ڥ͔ΒऔಘͰ͖Δ༷ʑͳ৘ใ ΩϟϥΫλʔͷҐஔ είΞͳͲ $FMMͷอଘͱ࠶ੜ  

    ؀ڥ͕ϦηοτՄೳͳ৔߹ ͦͷ··$FMMͷ΋ͭঢ়ଶΛ࢖ͬͯ౸ୡՄೳʢࠓճ͸͜Εʣ ؀ڥ͕ϦηοτෆՄೳ͕ܾͩఆ࿦తͳ৔߹ $FMMʹ౸Δ·ͰͷߦಈཤྺΛ࠶ੜ͢Δ ؀ڥ͕ϦηοτෆՄೳͰ͔ͭ֬཰తͳ৔߹ (PBMDPOEJUJPOFE1PMJDZ Λ࢖͏ ΰʔϧͱͳΔঢ়ଶΛϞσϧʹೖྗ͢Δ อଘ ࠶ੜ 4DIBVM5 )PSHBO% (SFHPS, BOE4JMWFS%  6OJWFSTBMWBMVFGVODUJPOBQQSPYJNBUPST*O *OUFSOBUJPOBM$POGFSFODFPO.BDIJOF-FBSOJOH QQ