Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
入門AlphaGo
Search
na-o-ys
April 22, 2016
Technology
5
3.8k
入門AlphaGo
"Mastering the game of Go with deep neural networks and tree search" の概要
na-o-ys
April 22, 2016
Tweet
Share
More Decks by na-o-ys
See All by na-o-ys
IoTと監視
naoys
1
770
RubyとJIT
naoys
0
160
将棋盤を画像認識したかった
naoys
0
1.5k
Rust で乗り換え案内
naoys
0
620
疎行列と Jaccard 類似度の高速計算
naoys
1
610
有理数集合の濃度
naoys
2
120
YARVの最適化について調べた
naoys
0
130
転職会議サービスのAWS移行記録
naoys
0
61
Anonymous Recursion in C++
naoys
0
420
Other Decks in Technology
See All in Technology
A2Aのクライアントを自作する
rynsuke
1
170
低レイヤを知りたいPHPerのためのCコンパイラ作成入門 完全版 / Building a C Compiler for PHPers Who Want to Dive into Low-Level Programming - Expanded
tomzoh
4
3.2k
データプラットフォーム技術におけるメダリオンアーキテクチャという考え方/DataPlatformWithMedallionArchitecture
smdmts
5
630
登壇ネタの見つけ方 / How to find talk topics
pinkumohikan
5
480
Postman AI エージェントビルダー最新情報
nagix
0
110
米国国防総省のDevSecOpsライフサイクルをAWSのセキュリティサービスとOSSで実現
syoshie
2
1.1k
Fabric + Databricks 2025.6 の最新情報ピックアップ
ryomaru0825
1
140
SalesforceArchitectGroupOsaka#20_CNX'25_Report
atomica7sei
0
170
セキュリティの民主化は何故必要なのか_AWS WAF 運用の 10 の苦悩から学ぶ
yoh
1
150
Amazon ECS & AWS Fargate 運用アーキテクチャ2025 / Amazon ECS and AWS Fargate Ops Architecture 2025
iselegant
16
5.5k
PHP開発者のためのSOLID原則再入門 #phpcon / PHP Conference Japan 2025
shogogg
4
750
生成AIでwebアプリケーションを作ってみた
tajimon
2
150
Featured
See All Featured
Docker and Python
trallard
44
3.4k
Become a Pro
speakerdeck
PRO
28
5.4k
The Language of Interfaces
destraynor
158
25k
Making Projects Easy
brettharned
116
6.3k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
17
940
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3k
Rails Girls Zürich Keynote
gr2m
94
14k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
670
Done Done
chrislema
184
16k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
The Straight Up "How To Draw Better" Workshop
denniskardys
234
140k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
281
13k
Transcript
ೖAlphaGo 0x64ޠ ୈ07 “AI” @na_o_ys
͝ҙ • จʹॻ͔Ε͍ͯͳ͍ಠࣗௐࠪਪଌؚ͕· Ε·͢ • Ұߟͩͱࢥͬͯݟ͍ͯͩ͘͞
AlphaGoͱ • ॳΊͯϓϩع࢜ΛഁͬͨғޟAI
ୈҰ෦: AlphaGoʹࢸΔ·Ͱ
શใήʔϜ • ΦηϩɺνΣεɺকعɺғޟɺetc • ϥϯμϜੑ͕ແ͘ɺ࠷ળख͕ଘࡏ͢Δ • (ݪཧతʹ) ઌखඞউɾޙखඞউɾҾ͖͚
ήʔϜ • શ୳ࡧͰ࠷ળख͕ٻ·Δ • ܭࢉྔతʹෆՄೳ … ݱہ໘ 1खޙ 2खޙ
ධՁؔ • ൫໘Λ༩͑ΔͱείΞ (༧উͳͲ) Λฦؔ͢ • কعνΣεͳΒɺۨͷଛಘޮ͖ͷΛݩʹܭࢉ • ήʔϜͷ୳ࡧൣғ(ਂ͞)ΛݶఆͰ͖Δ ݱہ໘
1खޙ 2खޙ ධՁˠ 0.1 0.8 0.3 0.4
ධՁؔͷ༗ޮੑ • ύϥϝʔλͷબఆɾઃఆ͕ΩϞ • ख࡞ۀ: νΣεͰਓؒΛ͑ͨ • ػցֶश: কعͰਓؒΛ͑ͨ •
ғޟෳࡶੑͷͨΊʹ·ͱͳධՁؔΛ࡞Εͳ͔ͬ ͨ
ݪ࢝ϞϯςΧϧϩ๏ • ϥϯμϜʹऴہ·Ͱଧͭ (ϩʔϧΞτ) Λ܁Γฦͯ͠ɺউΛܭ ࢉ͢Δํ๏ ϩʔϧΞτΛ܁Γฦͯ͠ উΛܭࢉ উ 7/10
উ 3/10
ϞϯςΧϧϩ୳ࡧ (MCTS) • ݪ࢝ϞϯςΧϧϩ๏ΛධՁؔతʹ͏ • n खઌͰϩʔϧΞτ • ༿ͷউΛܭࢉ ※͞Βʹ༿ͷউʹԠͯ͡ಈతʹࢬמΓɾల։͠ɺ୳ࡧਫ਼Λ্͛Δ
ϙϦγʔؔ • f (ہ໘, ࣍ͷҰख) • ࣍ͷҰखͷࣗવ͞Λ͋ΒΘ֬͢ີؔ • عේσʔλ͔Βͷֶश͕༰қ •
ϩʔϧΞτ࣌ʹ͑Δ • ϥϯμϜʹଧͭͷͰͳ͘ɺ·ͱͳखΛଧͨͤΔ • ͨͩ͠ߴʹಈ࡞͢Δඞཁ͕͋Δ
MCTSͷڧ͞ • ϙϦγʔؔͷͳͲͰΞϚνϡΞߴஈʹඖఢ͢Δڧ͞· Ͱਐา • ϓϩʹٴͳ͍ • େہ؍ʹ༏ΕΔ • ʮڱ͘ਂ͍ಡΈʯ͕ऑ͍
• खΛ͘ಡΉͨΊ
AlphaGo͕ͬͨ͜ͱ • جຊMCTS • ༷ʑͳ • CNN(ΈࠐΈχϡʔϥϧωοτϫʔΫ) • ڧԽֶश •
ධՁؔ • ฒྻࢄΞϧΰϦζϜ • MCTS ʹͦΕΒΛΈࠐΜͩ
ୈೋ෦: AlphaGo
2ͭͷϙϦγʔؔͱ 1ͭͷධՁؔ ϩʔϧΞτϙϦγʔ ϩʔϧΞτʹ͏ ߴɾਫ਼ 4-ϙϦγʔ ୳ࡧॱংΛܾΊΔ ɾߴਫ਼ ධՁؔ ༿ͷධՁ(উ)Λܭࢉ
ϩʔϧΞτʹΑΔউͱ͠߹ΘͤΔ
ϩʔϧΞτϙϦγʔ • ϩʔϧΞτ(ϥϯμϜϓϨΠ)ʹ͏ϙϦγʔؔ • ߴੑɹʼɹਫ਼ • ਓؒͷعේ800ສہ໘͔Βֶश • ઢܗιϑτϚοΫεؔ •
2ϚΠΫϩඵ (ߴ) • عේͱͷࢦ͠खҰக: 24.2%
SLϙϦγʔ • ͷ୳ࡧॱংΛܾΊΔϙϦγʔؔ • ਫ਼ɹʼɹߴੑ • ਓؒͷعේ3000ສہ໘͔Βֶश • 13CNN(ΈࠐΈχϡʔϥϧωοτϫʔΫ) •
ը૾ೝࣝͰΑ͘ΘΕΔ • : 3ϛϦඵ • عේͱͷࢦ͠खҰக: 57%
ධՁؔ • 14CNN • SLϙϦγʔΛڧԽֶशͨ͠ͷ (RLϙϦγʔ) Λݩʹɺճؼͯ͠࡞Δ 4-ϙϦγʔ 3-ϙϦγʔ ධՁؔ
1. ڧԽֶश 2. ϥϯμϜعේੜ (3000ສہ໘) 3. ճؼ
ධՁؔͷଊ͑ํ • ϩʔϧΞτʹΑΔউܭࢉΛิ͏ͷ • ୯ମͰͦ͜·Ͱڧ͘ͳ͍ • ධՁؔͷಛ (ߟ) • ʮڱ͘ਂ͍ಡΈʯʹڧ͍
• ʮRLϙϦγʔ(ڧԽֶश݁Ռ)Λऴہ·ͰଧͨͤͨࡍͷউʯͱՁ • େہ؍͕ແ͍ • Ұຊಓ͔͠ಡ·ͳ͍ .$54ͷಛੑ େہ؍ʹ༏Εͯʮਂ͍ಡΈʯ͕ऑ͍ ͱ ͏·͘ิ͍͍͋ͬͯΔ
ڧ͞ (2015/10࣌)
ڧ͞ (2016/3 ࣌) R3500+ ͷΠɾηυϧʹউ
ࢀߟ • Mastering the game of Go with deep neural
networks and tree search (http://www.nature.com/nature/journal/v529/n7587/full/ nature16961.html) • Google AlphaGoͷΈΛཧղ͢Δ | IT Leaders (http://it.impressbm.co.jp/articles/-/13474)
ऴΘΓ