Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ハンカチ落としの戦略最適化
Search
Katsuki Ohto
July 07, 2020
Science
0
1.1k
ハンカチ落としの戦略最適化
漫画「嘘喰い」に登場するハンカチ落としゲームを簡略化してナッシュ均衡戦略を計算します。
Katsuki Ohto
July 07, 2020
Tweet
Share
More Decks by Katsuki Ohto
See All by Katsuki Ohto
負け側の残り枚数を最大化する二人単貧民の解析
yuricat
0
98
二人単貧民の消費枚数に関する勝利条件の一般化とその解析
yuricat
0
190
二人単貧民の定理を Coqで証明する試み
yuricat
0
210
Other Decks in Science
See All in Science
データベース01: データベースを使わない世界
trycycle
PRO
1
780
深層学習を用いた根菜類の個数カウントによる収量推定法の開発
kentaitakura
0
180
統計的因果探索: 背景知識とデータにより因果仮説を探索する
sshimizu2006
4
1k
データベース12: 正規化(2/2) - データ従属性に基づく正規化
trycycle
PRO
0
970
Agent開発フレームワークのOverviewとW&B Weaveとのインテグレーション
siyoo
0
330
Symfony Console Facelift
chalasr
2
470
高校生就活へのDA導入の提案
shunyanoda
0
5.9k
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
320
データマイニング - コミュニティ発見
trycycle
PRO
0
150
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
940
ウェブ・ソーシャルメディア論文読み会 第25回: Differences in misinformation sharing can lead to politically asymmetric sanctions (Nature, 2024)
hkefka385
0
130
「美は世界を救う」を心理学で実証したい~クラファンを通じた新しい研究方法
jimpe_hitsuwari
1
160
Featured
See All Featured
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
A Modern Web Designer's Workflow
chriscoyier
696
190k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.7k
GraphQLの誤解/rethinking-graphql
sonatard
72
11k
Mobile First: as difficult as doing things right
swwweet
224
9.9k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
Bash Introduction
62gerente
615
210k
How to train your dragon (web standard)
notwaldorf
96
6.2k
Rails Girls Zürich Keynote
gr2m
95
14k
Making the Leap to Tech Lead
cromwellryan
135
9.5k
Transcript
ϋϯΧνམͱ͠ ͷઓུ࠷దԽ Katsuki Ohto Optimization Night #3 LT
ϋϯΧνམͱ͠ ➤ Ұൠతʹ… தఔͷਓͰߦ͏ ϨΫϦΤʔγϣϯήʔϜ ➤ ອըʮӕ͍ᷰʯಡऀʹ… ೋਓͰ໋ΛṌ͚ͯઓ͏ήʔϜ ϋϯΧνΛམͱ͢ํΛʮυϩοϓଆʯৼΓ͍ͯϋϯΧν͕མ ͪͨͷΛ֬ೝ͢ΔํΛʮνΣοΫଆʯͱ͠ɺަޓʹ୲͍ͯ͠
͘ɻਐߦʹ࣌ใΛར༻͢Δɻ1λʔϯ1ؒͱ͠ɺυϩοϓ ଆඞͣͦͷ࣌ؒʹམͱ͞ͳ͚ΕͳΒͣɺνΣοΫଆඞͣ Ұ͚ͩৼΓ͔ͳ͚ΕͳΒͳ͍ɻυϩοϓଆ͕ϋϯΧνΛ མͱͨ͠ॠ͔ؒΒνΣοΫଆͷʮ࠲ࢹͷࡍʯ͕ελʔτɺ༰ث ͷத֖͕։͖γϦϯμʔʹʮྟࢮༀʯ͕ཷ·͍ͬͯ͘ɻৼΓ͍ ͯϋϯΧν͕མ͍ͪͯΕνΣοΫޭͱͳΓத֖͕ด͡Δ͕ ٯʹམ͍ͪͯͳ͚ΕʮϖφϧςΟʯ͕ൃಈɻʮͦͷ࣌Ͱཷ ·͍ͬͯΔྟࢮༀʴ1ؒͰཷ·ΔྔʯΛͦͷͰࣹʢγϦϯ μʔʹྟࢮༀ͕5ؒཷ·ͬͨ߹ଈࣹʣ͞ΕΔɻͦͯ͠ ຺ഥ͕ࢭ·ͬͨͷΛ֬ೝ͔ͯ͠Βʮྟࢮʯ͕ελʔτɻϖφϧ ςΟඵΛফԽͨ͠ΒྟࢮༀͱରʹͳΔͷʮોੜༀʯΛ ্ࣹͨ͠Ͱ15ճݶఆͷ৺ଁϚοαʔδʢ10ඵؒ΄ͲʣΛߦ ͍ɺͦΕͰોੜͰ͖ͨΒήʔϜଓߦɺͰ͖ͳ͚Εউෛ͋Γɻ Wikipedia ʮӕ͍ᷰʯΑΓ
؆ུԽϧʔϧ ➤ υϩοϓଆ …ϋϯΧνΛམͱ͢ଆ ➤ νΣοΫଆ …ৼΓฦΔଆ ➤ ࣌ࠁ T
ඵؒ ➤ ϖφϧςΟʢ㲈ใुʣ ɾνΣοΫଆ͕མͱ͞Εͯ ɹ t ඵޙʹৼΓฦΔ… t ɾνΣοΫଆ͕ઌʹৼΓฦΔ ɹ… T ➤ ອըͰɺ͜ΕΛ෦ήʔϜͱͯ͠ ܁Γฦ͢ཁૉ͕͋Δ͕ɺ ࠓճ͜ͷҰճͷήʔϜ͚ͩߟ͑Δ
ಉ࣌ ήʔϜ ͷੑ࣭
͡ΌΜ͚Μ ➤ άʔΛग़͢ઓུʹ ˠύʔΛग़͢ઓུ͕༗ޮ ➤ ύʔΛग़͢ઓུʹ ˠνϣΩΛग़͢ઓུ͕༗ޮ ➤ νϣΩΛग़͢ઓུʹ ˠάʔΛग़͢ઓུ͕༗ޮ
➤ ઓུ͕॥͠ɺৗʹ࠷దͳ ઓུ͕ఆ·Βͳ͍ φογϡۉߧɹΛߟ͑Δ
φογϡۉߧઓུ ➤ ยํͷϓϨΠϠ͕͔ࣗΒख Λม͑ΔϝϦοτ͕ͳ͍ઓུ ʢͷΈ߹Θͤʣ ➤ ғޟকعͳΒউརखͲΕ͔ ҰͭΛબͿઓུͰOK ➤ ಉ࣌ήʔϜ
ɾ͡ΌΜ͚Μ ෆશใήʔϜ ɾϙʔΧʔɹɾຑ ͜ΕΒͷήʔϜͰ φογϡۉߧ֬తઓུ
ઓུ࠷ద Խ
తؔ ➤ ࣌ࠁ T+1 ·ͰԆ͠ɺνΣοΫଆɺυϩοϓଆ͕Կ͠ͳ͔ͬͨ߹ ࣌ࠁ T+1 ʹߦಈΛىͨ͜͜͠ͱʹ͢Δʢ݁ՌʹӨڹͳ͍ʣ ➤ ઓུ
࣌ࠁ i Ͱυϩοϓ͢Δ֬ ͨͩ͠ ࣌ࠁ j ͰνΣοΫ͢Δ֬ ͨͩ͠ ➤ ϖφϧςΟͷظ Di T+1 ∑ i=1 Di = 1 Cj T+1 ∑ j=1 Cj = 1 R(C, D) = T+1 ∑ i=1 Di ( i−1 ∑ j=1 Cj T + T+1 ∑ j=i Cj (j − i)) T=1ͷͱ͖ x = D1, y = C1ͱͯ͠
߆ଋ͖݅ͭͷఀཹ ➤ ϖφϧςΟͷظ ➤ φογϡۉߧͰɺνΣοΫଆɺυϩοϓଆ ͱʹઓུΛมߋ͢ΔΠϯηϯςΟϒ͕ͳ͍ ➤ →֬ͷ͕ 1ͱ͍͏ ɹ߆ଋ͖݅ͭͷఀཹ
➤ →ϥάϥϯδϡͷະఆ๏Λར༻͢Δ R(C, D) = T+1 ∑ i=1 Di ( i−1 ∑ j=1 Cj T + T+1 ∑ j=i Cj (j − i)) T=1ͷͱ͖ x = D1, y = C1ͱͯ͠
ϥάϥϯδϡͷະఆ๏ ➤ ཱࣜ ➤ ల։ ➤ ղऍ ͜ͷࣜ
͔ͭ ͱॻ͚Δ F = R(D, C) − γ( T+1 ∑ i=1 Di − 1) − λ( T+1 ∑ j=1 Cj − 1) ∂F ∂Dt = ∂F ∂Ct = ∂F ∂γ = ∂F ∂λ = 0 ∂F ∂Dt = t−1 ∑ j=1 Cj T + T+1 ∑ j=t Cj (j − t) − γ ∂F ∂Ct = t ∑ i=1 Di (t − i) + T+1 ∑ i=t+1 Di T − λ ∂R ∂Dt = const . ∂R ∂Ct = const .
νΣοΫଆͷԽࣜಋग़ ➤ υϩοϓଆͷ͔ࣜΒελʔτ ➤ ∂F ∂Dt =
0 = ∂F ∂Dt+1 t−1 ∑ j=1 Cj T + T+1 ∑ j=t Cj (j − t) − γ = t ∑ j=1 Cj T + T+1 ∑ j=t+1 Cj (j − t − 1) − γ 0 = Ct T − T+1 ∑ j=t+1 Cj Ct = ∑T+1 j=t+1 Cj T
υϩοϓଆͷԽࣜಋग़ ➤ νΣοΫଆͷ͔ࣜΒελʔτ ➤ ∂F ∂Ct =
0 = ∂F ∂Ct+1 t ∑ i=1 Di (t − i) + T+1 ∑ i=t+1 Di T − λ = t+1 ∑ i=1 Di (t + 1 − i) + T+1 ∑ i=t+2 Di T − λ Dt+1 T = t ∑ i=1 Di Dt+1 = ∑t i=1 Di T
ܭࢉ݁Ռ·ͱΊ ➤ ➤ ➤ ͜Ε͔Βͷ͔ࣜΒφογϡۉߧઓུ͕ఆ·Δ ➤ υϩοϓଆͱνΣοΫଆͰରশʹͳ͍ͬͯΔ ʢ͜͜ϖφϧςΟͷઃఆ࣍ୈʣ Dt+1
= ∑t i=1 Di T T+1 ∑ i=1 Di = 1 Ct = ∑T+1 j=t+1 Cj T T+1 ∑ i=1 Ci = 1
ઓུՄࢹ Խ
φογϡۉߧઓུ ➤ T = 10 ͷ߹Λਤࣔ ➤ υϩοϓଆʮ͙͢མͱ͢ʯ νΣοΫଆʮৼΓ͔ͣʯ ͷ͕֬Ұ൪ߴ͍
➤ ͦΕҎ֎Ͱ֬ΏΔ͔ ʹมԽ
࿈ଓ֦࣌ؒு ➤ T = 100Ͱͷ͚֬ͩԼ͕ Βͣɺ͋ͱ0ʹ͍͍ۙͮͯΔ ➤ ήʔϜΛ࣌ࠁ 0 ~
1 Ͱ࿈ଓత ʹ͢Δ֦ுΛߟ͑Δ ➤ ࿈ଓ֦࣌ؒுͰɺ υϩοϓଆʮ͙͢མͱ͢ʯ νΣοΫଆʮৼΓ͔ͣʯ ͷ֬ͷऩଋ ➤ ͦΕҎ֎Ͱ؇͔ͳ֬ີ ͕ఆ·Δ 1 e
͓ΘΓʹ ➤ ͡ΌΜ͚Μͱಉ͘͡ɺ φογϡۉߧઓུʹରͯ͠ઓུΛมԽͤͯ͞ɺ ϖφϧςΟͷظมԽͤͣɺฏۉҎ্উͭ͜ͱͳ͍ ➤ ͨͩ͠ɺφογϡۉߧΛ಄ʹೖΕ͓ͯ͘͜ͱͰɺ ઌʹࣗͷบΛόϥͣ͞ʹྫྷ੩ʹઓ͏͜ͱͰ͖Δ ➤ ࠓճ͕ࣜ؆୯ͰखܭࢉͰ͖͕ͨɺෳࡶͳ߹ػցͰ࠷దԽ͍ͯ͘͠
߹͋Δ ➤ ໋ΛṌ͚ͯʢṌ͚ͳͯ͘ʣ ϋϯΧνམͱ͠Ͱઓ͏߹ʹ φογϡۉߧͷ͜ͱࢥ͍ग़ͯ͠ཉ͍͠Ͱ͢ɻ