Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
7章 線形モデル上のバンディット問題
Search
Takashi Nishibayashi
November 30, 2016
Technology
4.8k
3
Share
7章 線形モデル上のバンディット問題
機械学習プロフェッショナルシリーズ輪読会 ~バンディット問題の理論とアルゴリズム~ の資料です
Takashi Nishibayashi
November 30, 2016
More Decks by Takashi Nishibayashi
See All by Takashi Nishibayashi
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
610
入院医療費算定業務をAIで支援する:包括医療費支払い制度とDPCコーディング (公開版)
hagino3000
0
200
診断前の病歴テキストを対象としたLLMによるエンティティリンキング精度検証
hagino3000
1
190
論文紹介 Improving Medical Reasoning through Retrieval and Self-Reflection with Retrieval-Augmented Large Language Models
hagino3000
0
950
論文紹介 Audience Size Forecasting Fast and Smart Budget Planning for Media Buyers
hagino3000
0
260
論文紹介 Towards a Fair Marketplace: Counterfactual Evaluation of the trade-off between Relevance, Fairness & Satisfaction in Recommendation Systems
hagino3000
1
670
論文紹介 Budget Management Strategies in Repeated Auctions (公開版)
hagino3000
2
330
論文紹介 A Request-level Guaranteed Delivery Advertising Planning: Forecasting and Allocation
hagino3000
1
160
論文紹介 Online Experimentation with Surrogate Metrics Guidelines and a Case Study
hagino3000
1
420
Other Decks in Technology
See All in Technology
プロンプトエンジニアリングを超えて:自由と統制のあいだでつくる Platform × Context Engineering
yuriemori
0
170
終盤で崩壊させないAI駆動開発
j5ik2o
0
470
LLM とプロンプトエンジニアリング/チューターを定義する / LLMs and Prompt Engineering, and Defining Tutors
ks91
PRO
0
330
Kubernetes基盤における開発者体験 とセキュリティの両⽴ / Balancing developer experience and security in a Kubernetes-based environment
chmikata
0
240
解剖"React Native"
hacusk
0
120
仕様通り動くの先へ。Claude Codeで「使える」を検証する
gotalab555
8
3.2k
Zero Data Loss Autonomous Recovery Service サービス概要
oracle4engineer
PRO
5
14k
Oracle Cloud Infrastructure(OCI):Onboarding Session(はじめてのOCI/Oracle Supportご利⽤ガイド)
oracle4engineer
PRO
2
17k
60分で学ぶ最新Webフロントエンド
mizdra
PRO
3
770
AI前提とはどういうことか
daisuketakeda
0
180
3つのボトルネックを解消し、リリースエンジニアリングを再定義した話
nealle
0
370
【Findy FDE登壇_2026_04_14】— 現場課題を本気で解いてたら、FDEになってた話
miyatakoji
0
920
Featured
See All Featured
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Side Projects
sachag
455
43k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
140
Thoughts on Productivity
jonyablonski
76
5.1k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
170
The Cult of Friendly URLs
andyhume
79
6.8k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
190
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
510
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Transcript
ষ ઢܗϞσϧ্ͷόϯσΟοτ ػցֶशϓϩϑΣογϣφϧγϦʔζྠಡձ dόϯσΟοτͷཧͱΞϧΰϦζϜ<>d !IBHJOP 5BLBTIJ/JTIJCBZBTIJ <>ʮόϯσΟοτͷཧͱΞϧΰϦζϜʯຊଟ३ʗதଜಞɾஶ
ࣗݾհ ID: hagino3000 Name: ྛ (Takashi Nishibayashi) Job: Software
Engineer ݱࡏΞυωοτϫʔΫࣄۀऀʹͯ৴ޮͷ࠷ దԽʹैࣄ (ೖࡳՁ֨ௐϩδοΫɾࠂબϩ δοΫͷઃܭ͔Β࣮·Ͱ)
ઢܗόϯσΟοτ s t e6 e4 e5 e3 e2 e1 ྫ
࢝T͔ΒऴUʹ͋ΔσʔλʹԿΒ͔ͷ ܦ࿏Λ௨ͯ͠ΞΫηε͢ΔͦΕͧΕͷࢬ FKͰະͷ௨৴ԆВK͕ੜ͡Δ͜ͷ࣌ ʹԿσʔλʹΞΫηεͨ࣌͠ʹཁ͠ ͨ௨৴࣌ؒΛ࠷খԽ͢ΔࣄΛߟ͑Δ
௨৴ωοτϫʔΫͷྫ T͔ΒUͷܦ࿏i㱨\ ʜ ^࣍ͷΑ͏ͳϕΫτϧai 㱨\ ^ͰදΘͤΔɽ ܦ࿏ϕΫτϧશମͷू߹ΛA\ai ^i 㱨\
^Ͱ͋ΒΘ͢ɽ ͜ͷ࣌ɼܦ࿏ai 㱨AΛ༻͍ͨ࣌ͷ௨৴࣌ؒВ В В В 5ʹରͯ͠
ΑΓҰൠతʹ ֤εϩοτϚγϯ͕d ࣍ݩͷϕΫτϧai 㱨A㱬RdʹରԠɽͦͷใु PSଛࣦ ͕ظͷޡ߲ࠩЏ t Λ༻͍ͨઢܗϞσϧ Ͱද͞ΕΔઃఆʹ͓͍ͯྦྷੵใुͷ࠷େԽΛࢦ͢ΛઢܗόϯσΟο τ
MJOFBSCBOEJU ͱΑͿɽ dcAcͰ͋Γ a1 , a2 ,,,a|A| ͕୯ҐߦྻͱͳΔ߹લষ·Ͱͷجຊతͳό ϯσΟοτʹରԠ͢Δɽ ઢܗόϯσΟοτͷจ຺Ͱଟ͘ͷ߹ʹ֤ީิߦಈ BDUJPO ͱΑ ΕΔɽ
ઢܗόϯσΟοτͷSFHSFU ใुظ࠷େͷߦಈ Λબ͠ଓ͚Δ߹ͱൺֱͨ࣌͠ͷଛࣦ 6$#ํࡦΛద༻ͨ͠߹ͷϦάϨοτKcAcʹରͯ͠0 KMPHT ɼcAc͕ ඇৗʹେ͖͘ͳΔ߹ʹผͷํࡦΛߟ͑Δඞཁ͕͋Δɽ
ྫ w 8FCαΠτ࠷దԽ w όϯσΟοτ࠷ద༧ࢉ w ઢܕܭըͷҰ෦ͷ͕ະ w όϯσΟοτઢܗܭը w
ߦಈͷީิcAc㱣
จ຺͖όϯσΟοτ ֤ߦಈͷಛྔ͕ai,t ͱ͍ͬͨܗͰ࣌ࠁʹΑΓҟͳΔΛऔΔ͜ͱΛڐ͢ઃ ఆɽ࠷୯७ͳઃఆͱͯ͠ɼ࣌ࠁUʹԠͨ͡จ຺͕ଘࡏ͢Δͷͷظ࠷େͷ ߦಈ࣌ࠁtʹΑΒͳ͍߹Λߟ͑Δɽ ߦಈͱจ຺ͷަޓ࡞༻ແ͠ˠظ࠷େͷσβΠϯ࣌ࠁtʹґଘ͠ͳ͍ σβΠϯʹΑΔಛྔ ΫϦοΫ ࣌ࠁUʹґଘ͢Δಛྔ ฏPSٳɼϢʔβʔͷྸ
FUDʜ
ߦಈͱจ຺ͷަޓ࡞༻͕͋ΔϞσϧ σβΠϯ͕ύλʔϯ ࣌ࠁUʹґଘ͢ΔϢʔβʔ ͷ͕ύλʔϯͷ߹ 3FHSFU֤࣌ࠁͰৗʹظ࠷େΛͱͬͨ߹ͱͷൺֱ
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ% σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1.
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
-JO6$#ํࡦ ઢܗϞσϧʹର͢Δ6$#ํࡦͰ͋Δ-JO6$#ํࡦ -JO6$#QPMJDZ ֤ߦಈ͝ͱͷ6$#είΞ ͜͜ͰЋt 0 㲋MPH5 Id d
x dͷ୯ҐߦྻɼA-1ߦྻ ͷٯߦྻɽ ޡ߲ࠩͷࢄɼύϥϝʔλ 2 > 0 2 0 , ↵ > 0
-JO6$#ͷ6$#είΞͷߏ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷਪఆ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷඪ४ภࠩ
ઢܗϞσϧ্ͷτϯϓιϯநग़ ਖ਼نϞσϧͰͷࣄޙ֬ͷܭࢉɽ ใुͷޡ߲ࠩЏ U ͕طͷࢄМͷਖ਼نʹै͏߹ Λߟ͑ΔͷВͷࣄޙΛར༻͢ΔͱΞϧΰϦζϜ Вͷࣄޙ͔֬Βαϯϓϧ
ޡ߲͕ࠩਖ਼نͰͳ͍߹ w ΫϦοΫͳͲͷϞσϧͰޡ߲ࠩࢄͱͳΓਖ਼نʹ ैΘͳ͍ w ਖ਼֬ͳࣄޙ͔ΒͷཚੜՄೳ͕ͩܭࢉ͕ඇৗʹෳࡶʹ ͳΔ w τϯϓιϯநग़Ͱਖ਼نΛԾఆͨ͠ΞϧΰϦζϜΛར༻ ͕ͯ͠ԿΒ͔ͷఆ3ʹ͍ͭͯྼΨεతͰ͋Εɼదͳ
МΛऔΔࣄͰখ͞ͳϦάϨοτΛୡͰ͖Δ w ࣮ݧతʹτϯϓιϯநग़-JO6$#ํࡦΑΓΑ͍ੑೳͱͳΔ ߹͕ଟ͍ w ΫϦοΫϞσϧͷΑ͏ʹͰ͋Δ߹ʹྼΨε ͷఆ3Λ༻͍Δͷ͕Ұൠత
࣮ݧͯ͠Έͨ w ࣮ίʔυ w IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT CMPCNBTUFS.-1@CBOEJU$IBQJQZOC w ใुਅͷВͱਅͷࢄ͔Βੜͨ͠ w ޡ߲ࠩͷطͷࢄใुΛճ΄Ͳੜͤͯ͞ಘͨ
w ݁Ռ w ࣮ݧͰ5IPNQTPOநग़ͱ-JO6$#ͷ͕ࠩग़ͣ w ͨͩ͠ࠂ৴ใु͕ͦͷͰ؍ଌͰ͖ͳ͍ͷͰ-JO6$#͑ͳ͍ w 5IPNQTPOநग़ใु͕Εͯͳ͠ w ύϥϝʔλνϡʔχϯά w М ˠВͷࣄલ͕Ͱ͋Δͱߟ͑Δࣄʹ૬
ϩδεςΟοΫճؼϞσϧ্ͷ όϯσΟοτ ใु͕ͷ߹ʹΑΓదͨ͠Ϟσϧɽใु9J U 㱨\ ^ͷ֬ ͷใुΛߟ͑ͨ࣌ͷظ࠷େͷߦಈ Вͷࣄޙ͕ཉ͍͠ ˠਖ਼نͷΑ͏ͳดͨ͡ܗͰ͋ΒΘͤͳ͍ɽ ˠ͜ͷຊͰϥϓϥεۙࣅΛར༻
ˠͰۙࣅ
ϩδεςΟοΫճؼϞσϧ্ͷόϯ σΟοτͷੑೳ w ཧอূແ͍͕࣮༻্༗ޮΒ͍͠ w 4-4DPUU.VMUJBSNFECBOEJUFYQFSJNFOUTJOUIF POMJOFTFSWJDFFDPOPNZ
ใु͕ͷ߹ͷ࣮ݧ w ͔֬ʹଞͷΞϧΰϦζϜΑΓϩδεςΟοΫճؼϞσϧͷ 5IPNQTPOநग़ͷํ͕ੑೳ͕ྑ͍ w -JO6$#ɼใुͷޡ͕ࠩਖ਼نΛաఔͨ͠5IPNQTPOநग़ &QTJMPO(SFFEZΑΓѱ͘ͳͬͨ w ݁Ռϊʔτ IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT
CMPCNBTUFS.-1@CBOEJU$IBQ@CJOBSZ@SFXBSEJQZOC