Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
7章 線形モデル上のバンディット問題
Search
Takashi Nishibayashi
November 30, 2016
Technology
3
4.8k
7章 線形モデル上のバンディット問題
機械学習プロフェッショナルシリーズ輪読会 ~バンディット問題の理論とアルゴリズム~ の資料です
Takashi Nishibayashi
November 30, 2016
Tweet
Share
More Decks by Takashi Nishibayashi
See All by Takashi Nishibayashi
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
560
入院医療費算定業務をAIで支援する:包括医療費支払い制度とDPCコーディング (公開版)
hagino3000
0
190
診断前の病歴テキストを対象としたLLMによるエンティティリンキング精度検証
hagino3000
1
180
論文紹介 Improving Medical Reasoning through Retrieval and Self-Reflection with Retrieval-Augmented Large Language Models
hagino3000
0
940
論文紹介 Audience Size Forecasting Fast and Smart Budget Planning for Media Buyers
hagino3000
0
260
論文紹介 Towards a Fair Marketplace: Counterfactual Evaluation of the trade-off between Relevance, Fairness & Satisfaction in Recommendation Systems
hagino3000
1
660
論文紹介 Budget Management Strategies in Repeated Auctions (公開版)
hagino3000
2
330
論文紹介 A Request-level Guaranteed Delivery Advertising Planning: Forecasting and Allocation
hagino3000
1
150
論文紹介 Online Experimentation with Surrogate Metrics Guidelines and a Case Study
hagino3000
1
410
Other Decks in Technology
See All in Technology
大規模サービスにおける レガシーコードからReactへの移行
magicpod
1
130
Data Hubグループ 紹介資料
sansan33
PRO
0
2.8k
20260305_【白金鉱業】分析者が地理情報を武器にするための軽量なアドホック分析環境
yucho147
1
170
「ヒットする」+「近い」を同時にかなえるスマートサジェストの作り方.pdf
nakasho
0
110
Oracle Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
5
1.1k
大規模な組織におけるAI Agent活用の促進と課題
lycorptech_jp
PRO
6
7.8k
EMからICへ、二周目人材としてAI全振りのプロダクト開発で見つけた武器
yug1224
4
410
パネルディスカッション資料 (at Tableau Now! - 2026-02-26)
yoshitakaarakawa
0
1.1k
越境する組織づくり ─ 多様性を前提にしたチームビルディングとリードの実践知
kido_engineer
1
110
Master Dataグループ紹介資料
sansan33
PRO
1
4.4k
バクラクのSREにおけるAgentic AIへの挑戦/Our Journey with Agentic AI
taddy_919
2
1k
Eight Engineering Unit 紹介資料
sansan33
PRO
1
6.9k
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Designing for Timeless Needs
cassininazir
0
150
Believing is Seeing
oripsolob
1
72
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
The Pragmatic Product Professional
lauravandoore
37
7.2k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
190
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.8k
Faster Mobile Websites
deanohume
310
31k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Transcript
ষ ઢܗϞσϧ্ͷόϯσΟοτ ػցֶशϓϩϑΣογϣφϧγϦʔζྠಡձ dόϯσΟοτͷཧͱΞϧΰϦζϜ<>d !IBHJOP 5BLBTIJ/JTIJCBZBTIJ <>ʮόϯσΟοτͷཧͱΞϧΰϦζϜʯຊଟ३ʗதଜಞɾஶ
ࣗݾհ ID: hagino3000 Name: ྛ (Takashi Nishibayashi) Job: Software
Engineer ݱࡏΞυωοτϫʔΫࣄۀऀʹͯ৴ޮͷ࠷ దԽʹैࣄ (ೖࡳՁ֨ௐϩδοΫɾࠂબϩ δοΫͷઃܭ͔Β࣮·Ͱ)
ઢܗόϯσΟοτ s t e6 e4 e5 e3 e2 e1 ྫ
࢝T͔ΒऴUʹ͋ΔσʔλʹԿΒ͔ͷ ܦ࿏Λ௨ͯ͠ΞΫηε͢ΔͦΕͧΕͷࢬ FKͰະͷ௨৴ԆВK͕ੜ͡Δ͜ͷ࣌ ʹԿσʔλʹΞΫηεͨ࣌͠ʹཁ͠ ͨ௨৴࣌ؒΛ࠷খԽ͢ΔࣄΛߟ͑Δ
௨৴ωοτϫʔΫͷྫ T͔ΒUͷܦ࿏i㱨\ ʜ ^࣍ͷΑ͏ͳϕΫτϧai 㱨\ ^ͰදΘͤΔɽ ܦ࿏ϕΫτϧશମͷू߹ΛA\ai ^i 㱨\
^Ͱ͋ΒΘ͢ɽ ͜ͷ࣌ɼܦ࿏ai 㱨AΛ༻͍ͨ࣌ͷ௨৴࣌ؒВ В В В 5ʹରͯ͠
ΑΓҰൠతʹ ֤εϩοτϚγϯ͕d ࣍ݩͷϕΫτϧai 㱨A㱬RdʹରԠɽͦͷใु PSଛࣦ ͕ظͷޡ߲ࠩЏ t Λ༻͍ͨઢܗϞσϧ Ͱද͞ΕΔઃఆʹ͓͍ͯྦྷੵใुͷ࠷େԽΛࢦ͢ΛઢܗόϯσΟο τ
MJOFBSCBOEJU ͱΑͿɽ dcAcͰ͋Γ a1 , a2 ,,,a|A| ͕୯ҐߦྻͱͳΔ߹લষ·Ͱͷجຊతͳό ϯσΟοτʹରԠ͢Δɽ ઢܗόϯσΟοτͷจ຺Ͱଟ͘ͷ߹ʹ֤ީิߦಈ BDUJPO ͱΑ ΕΔɽ
ઢܗόϯσΟοτͷSFHSFU ใुظ࠷େͷߦಈ Λબ͠ଓ͚Δ߹ͱൺֱͨ࣌͠ͷଛࣦ 6$#ํࡦΛద༻ͨ͠߹ͷϦάϨοτKcAcʹରͯ͠0 KMPHT ɼcAc͕ ඇৗʹେ͖͘ͳΔ߹ʹผͷํࡦΛߟ͑Δඞཁ͕͋Δɽ
ྫ w 8FCαΠτ࠷దԽ w όϯσΟοτ࠷ద༧ࢉ w ઢܕܭըͷҰ෦ͷ͕ະ w όϯσΟοτઢܗܭը w
ߦಈͷީิcAc㱣
จ຺͖όϯσΟοτ ֤ߦಈͷಛྔ͕ai,t ͱ͍ͬͨܗͰ࣌ࠁʹΑΓҟͳΔΛऔΔ͜ͱΛڐ͢ઃ ఆɽ࠷୯७ͳઃఆͱͯ͠ɼ࣌ࠁUʹԠͨ͡จ຺͕ଘࡏ͢Δͷͷظ࠷େͷ ߦಈ࣌ࠁtʹΑΒͳ͍߹Λߟ͑Δɽ ߦಈͱจ຺ͷަޓ࡞༻ແ͠ˠظ࠷େͷσβΠϯ࣌ࠁtʹґଘ͠ͳ͍ σβΠϯʹΑΔಛྔ ΫϦοΫ ࣌ࠁUʹґଘ͢Δಛྔ ฏPSٳɼϢʔβʔͷྸ
FUDʜ
ߦಈͱจ຺ͷަޓ࡞༻͕͋ΔϞσϧ σβΠϯ͕ύλʔϯ ࣌ࠁUʹґଘ͢ΔϢʔβʔ ͷ͕ύλʔϯͷ߹ 3FHSFU֤࣌ࠁͰৗʹظ࠷େΛͱͬͨ߹ͱͷൺֱ
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ% σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1.
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
-JO6$#ํࡦ ઢܗϞσϧʹର͢Δ6$#ํࡦͰ͋Δ-JO6$#ํࡦ -JO6$#QPMJDZ ֤ߦಈ͝ͱͷ6$#είΞ ͜͜ͰЋt 0 㲋MPH5 Id d
x dͷ୯ҐߦྻɼA-1ߦྻ ͷٯߦྻɽ ޡ߲ࠩͷࢄɼύϥϝʔλ 2 > 0 2 0 , ↵ > 0
-JO6$#ͷ6$#είΞͷߏ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷਪఆ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷඪ४ภࠩ
ઢܗϞσϧ্ͷτϯϓιϯநग़ ਖ਼نϞσϧͰͷࣄޙ֬ͷܭࢉɽ ใुͷޡ߲ࠩЏ U ͕طͷࢄМͷਖ਼نʹै͏߹ Λߟ͑ΔͷВͷࣄޙΛར༻͢ΔͱΞϧΰϦζϜ Вͷࣄޙ͔֬Βαϯϓϧ
ޡ߲͕ࠩਖ਼نͰͳ͍߹ w ΫϦοΫͳͲͷϞσϧͰޡ߲ࠩࢄͱͳΓਖ਼نʹ ैΘͳ͍ w ਖ਼֬ͳࣄޙ͔ΒͷཚੜՄೳ͕ͩܭࢉ͕ඇৗʹෳࡶʹ ͳΔ w τϯϓιϯநग़Ͱਖ਼نΛԾఆͨ͠ΞϧΰϦζϜΛར༻ ͕ͯ͠ԿΒ͔ͷఆ3ʹ͍ͭͯྼΨεతͰ͋Εɼదͳ
МΛऔΔࣄͰখ͞ͳϦάϨοτΛୡͰ͖Δ w ࣮ݧతʹτϯϓιϯநग़-JO6$#ํࡦΑΓΑ͍ੑೳͱͳΔ ߹͕ଟ͍ w ΫϦοΫϞσϧͷΑ͏ʹͰ͋Δ߹ʹྼΨε ͷఆ3Λ༻͍Δͷ͕Ұൠత
࣮ݧͯ͠Έͨ w ࣮ίʔυ w IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT CMPCNBTUFS.-1@CBOEJU$IBQJQZOC w ใुਅͷВͱਅͷࢄ͔Βੜͨ͠ w ޡ߲ࠩͷطͷࢄใुΛճ΄Ͳੜͤͯ͞ಘͨ
w ݁Ռ w ࣮ݧͰ5IPNQTPOநग़ͱ-JO6$#ͷ͕ࠩग़ͣ w ͨͩ͠ࠂ৴ใु͕ͦͷͰ؍ଌͰ͖ͳ͍ͷͰ-JO6$#͑ͳ͍ w 5IPNQTPOநग़ใु͕Εͯͳ͠ w ύϥϝʔλνϡʔχϯά w М ˠВͷࣄલ͕Ͱ͋Δͱߟ͑Δࣄʹ૬
ϩδεςΟοΫճؼϞσϧ্ͷ όϯσΟοτ ใु͕ͷ߹ʹΑΓదͨ͠Ϟσϧɽใु9J U 㱨\ ^ͷ֬ ͷใुΛߟ͑ͨ࣌ͷظ࠷େͷߦಈ Вͷࣄޙ͕ཉ͍͠ ˠਖ਼نͷΑ͏ͳดͨ͡ܗͰ͋ΒΘͤͳ͍ɽ ˠ͜ͷຊͰϥϓϥεۙࣅΛར༻
ˠͰۙࣅ
ϩδεςΟοΫճؼϞσϧ্ͷόϯ σΟοτͷੑೳ w ཧอূແ͍͕࣮༻্༗ޮΒ͍͠ w 4-4DPUU.VMUJBSNFECBOEJUFYQFSJNFOUTJOUIF POMJOFTFSWJDFFDPOPNZ
ใु͕ͷ߹ͷ࣮ݧ w ͔֬ʹଞͷΞϧΰϦζϜΑΓϩδεςΟοΫճؼϞσϧͷ 5IPNQTPOநग़ͷํ͕ੑೳ͕ྑ͍ w -JO6$#ɼใुͷޡ͕ࠩਖ਼نΛաఔͨ͠5IPNQTPOநग़ &QTJMPO(SFFEZΑΓѱ͘ͳͬͨ w ݁Ռϊʔτ IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT
CMPCNBTUFS.-1@CBOEJU$IBQ@CJOBSZ@SFXBSEJQZOC