Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
入門AlphaGo
Search
na-o-ys
April 22, 2016
Technology
5
3.7k
入門AlphaGo
"Mastering the game of Go with deep neural networks and tree search" の概要
na-o-ys
April 22, 2016
Tweet
Share
More Decks by na-o-ys
See All by na-o-ys
IoTと監視
naoys
1
700
RubyとJIT
naoys
0
140
将棋盤を画像認識したかった
naoys
0
1.5k
Rust で乗り換え案内
naoys
0
610
疎行列と Jaccard 類似度の高速計算
naoys
1
550
有理数集合の濃度
naoys
2
110
YARVの最適化について調べた
naoys
0
110
転職会議サービスのAWS移行記録
naoys
0
50
Anonymous Recursion in C++
naoys
0
400
Other Decks in Technology
See All in Technology
開発生産性を上げながらビジネスも30倍成長させてきたチームの姿
kamina_zzz
2
1.7k
Security-JAWS【第35回】勉強会クラウドにおけるマルウェアやコンテンツ改ざんへの対策
4su_para
0
180
サイバーセキュリティと認知バイアス:対策の隙を埋める心理学的アプローチ
shumei_ito
0
380
フルカイテン株式会社 採用資料
fullkaiten
0
40k
なぜ今 AI Agent なのか _近藤憲児
kenjikondobai
4
1.4k
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
220
TypeScript、上達の瞬間
sadnessojisan
46
13k
Incident Response Practices: Waroom's Features and Future Challenges
rrreeeyyy
0
160
rootlessコンテナのすゝめ - 研究室サーバーでもできる安全なコンテナ管理
kitsuya0828
3
380
OCI Network Firewall 概要
oracle4engineer
PRO
0
4.1k
誰も全体を知らない ~ ロールの垣根を超えて引き上げる開発生産性 / Boosting Development Productivity Across Roles
kakehashi
1
220
ノーコードデータ分析ツールで体験する時系列データ分析超入門
negi111111
0
410
Featured
See All Featured
Scaling GitHub
holman
458
140k
Fireside Chat
paigeccino
34
3k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.1k
Testing 201, or: Great Expectations
jmmastey
38
7.1k
YesSQL, Process and Tooling at Scale
rocio
169
14k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.1k
Site-Speed That Sticks
csswizardry
0
23
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
The Language of Interfaces
destraynor
154
24k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Transcript
ೖAlphaGo 0x64ޠ ୈ07 “AI” @na_o_ys
͝ҙ • จʹॻ͔Ε͍ͯͳ͍ಠࣗௐࠪਪଌؚ͕· Ε·͢ • Ұߟͩͱࢥͬͯݟ͍ͯͩ͘͞
AlphaGoͱ • ॳΊͯϓϩع࢜ΛഁͬͨғޟAI
ୈҰ෦: AlphaGoʹࢸΔ·Ͱ
શใήʔϜ • ΦηϩɺνΣεɺকعɺғޟɺetc • ϥϯμϜੑ͕ແ͘ɺ࠷ળख͕ଘࡏ͢Δ • (ݪཧతʹ) ઌखඞউɾޙखඞউɾҾ͖͚
ήʔϜ • શ୳ࡧͰ࠷ળख͕ٻ·Δ • ܭࢉྔతʹෆՄೳ … ݱہ໘ 1खޙ 2खޙ
ධՁؔ • ൫໘Λ༩͑ΔͱείΞ (༧উͳͲ) Λฦؔ͢ • কعνΣεͳΒɺۨͷଛಘޮ͖ͷΛݩʹܭࢉ • ήʔϜͷ୳ࡧൣғ(ਂ͞)ΛݶఆͰ͖Δ ݱہ໘
1खޙ 2खޙ ධՁˠ 0.1 0.8 0.3 0.4
ධՁؔͷ༗ޮੑ • ύϥϝʔλͷબఆɾઃఆ͕ΩϞ • ख࡞ۀ: νΣεͰਓؒΛ͑ͨ • ػցֶश: কعͰਓؒΛ͑ͨ •
ғޟෳࡶੑͷͨΊʹ·ͱͳධՁؔΛ࡞Εͳ͔ͬ ͨ
ݪ࢝ϞϯςΧϧϩ๏ • ϥϯμϜʹऴہ·Ͱଧͭ (ϩʔϧΞτ) Λ܁Γฦͯ͠ɺউΛܭ ࢉ͢Δํ๏ ϩʔϧΞτΛ܁Γฦͯ͠ উΛܭࢉ উ 7/10
উ 3/10
ϞϯςΧϧϩ୳ࡧ (MCTS) • ݪ࢝ϞϯςΧϧϩ๏ΛධՁؔతʹ͏ • n खઌͰϩʔϧΞτ • ༿ͷউΛܭࢉ ※͞Βʹ༿ͷউʹԠͯ͡ಈతʹࢬמΓɾల։͠ɺ୳ࡧਫ਼Λ্͛Δ
ϙϦγʔؔ • f (ہ໘, ࣍ͷҰख) • ࣍ͷҰखͷࣗવ͞Λ͋ΒΘ֬͢ີؔ • عේσʔλ͔Βͷֶश͕༰қ •
ϩʔϧΞτ࣌ʹ͑Δ • ϥϯμϜʹଧͭͷͰͳ͘ɺ·ͱͳखΛଧͨͤΔ • ͨͩ͠ߴʹಈ࡞͢Δඞཁ͕͋Δ
MCTSͷڧ͞ • ϙϦγʔؔͷͳͲͰΞϚνϡΞߴஈʹඖఢ͢Δڧ͞· Ͱਐา • ϓϩʹٴͳ͍ • େہ؍ʹ༏ΕΔ • ʮڱ͘ਂ͍ಡΈʯ͕ऑ͍
• खΛ͘ಡΉͨΊ
AlphaGo͕ͬͨ͜ͱ • جຊMCTS • ༷ʑͳ • CNN(ΈࠐΈχϡʔϥϧωοτϫʔΫ) • ڧԽֶश •
ධՁؔ • ฒྻࢄΞϧΰϦζϜ • MCTS ʹͦΕΒΛΈࠐΜͩ
ୈೋ෦: AlphaGo
2ͭͷϙϦγʔؔͱ 1ͭͷධՁؔ ϩʔϧΞτϙϦγʔ ϩʔϧΞτʹ͏ ߴɾਫ਼ 4-ϙϦγʔ ୳ࡧॱংΛܾΊΔ ɾߴਫ਼ ධՁؔ ༿ͷධՁ(উ)Λܭࢉ
ϩʔϧΞτʹΑΔউͱ͠߹ΘͤΔ
ϩʔϧΞτϙϦγʔ • ϩʔϧΞτ(ϥϯμϜϓϨΠ)ʹ͏ϙϦγʔؔ • ߴੑɹʼɹਫ਼ • ਓؒͷعේ800ສہ໘͔Βֶश • ઢܗιϑτϚοΫεؔ •
2ϚΠΫϩඵ (ߴ) • عේͱͷࢦ͠खҰக: 24.2%
SLϙϦγʔ • ͷ୳ࡧॱংΛܾΊΔϙϦγʔؔ • ਫ਼ɹʼɹߴੑ • ਓؒͷعේ3000ສہ໘͔Βֶश • 13CNN(ΈࠐΈχϡʔϥϧωοτϫʔΫ) •
ը૾ೝࣝͰΑ͘ΘΕΔ • : 3ϛϦඵ • عේͱͷࢦ͠खҰக: 57%
ධՁؔ • 14CNN • SLϙϦγʔΛڧԽֶशͨ͠ͷ (RLϙϦγʔ) Λݩʹɺճؼͯ͠࡞Δ 4-ϙϦγʔ 3-ϙϦγʔ ධՁؔ
1. ڧԽֶश 2. ϥϯμϜعේੜ (3000ສہ໘) 3. ճؼ
ධՁؔͷଊ͑ํ • ϩʔϧΞτʹΑΔউܭࢉΛิ͏ͷ • ୯ମͰͦ͜·Ͱڧ͘ͳ͍ • ධՁؔͷಛ (ߟ) • ʮڱ͘ਂ͍ಡΈʯʹڧ͍
• ʮRLϙϦγʔ(ڧԽֶश݁Ռ)Λऴہ·ͰଧͨͤͨࡍͷউʯͱՁ • େہ؍͕ແ͍ • Ұຊಓ͔͠ಡ·ͳ͍ .$54ͷಛੑ େہ؍ʹ༏Εͯʮਂ͍ಡΈʯ͕ऑ͍ ͱ ͏·͘ิ͍͍͋ͬͯΔ
ڧ͞ (2015/10࣌)
ڧ͞ (2016/3 ࣌) R3500+ ͷΠɾηυϧʹউ
ࢀߟ • Mastering the game of Go with deep neural
networks and tree search (http://www.nature.com/nature/journal/v529/n7587/full/ nature16961.html) • Google AlphaGoͷΈΛཧղ͢Δ | IT Leaders (http://it.impressbm.co.jp/articles/-/13474)
ऴΘΓ