Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
7章 線形モデル上のバンディット問題
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Takashi Nishibayashi
November 30, 2016
Technology
3
4.8k
7章 線形モデル上のバンディット問題
機械学習プロフェッショナルシリーズ輪読会 ~バンディット問題の理論とアルゴリズム~ の資料です
Takashi Nishibayashi
November 30, 2016
Tweet
Share
More Decks by Takashi Nishibayashi
See All by Takashi Nishibayashi
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
580
入院医療費算定業務をAIで支援する:包括医療費支払い制度とDPCコーディング (公開版)
hagino3000
0
190
診断前の病歴テキストを対象としたLLMによるエンティティリンキング精度検証
hagino3000
1
180
論文紹介 Improving Medical Reasoning through Retrieval and Self-Reflection with Retrieval-Augmented Large Language Models
hagino3000
0
940
論文紹介 Audience Size Forecasting Fast and Smart Budget Planning for Media Buyers
hagino3000
0
260
論文紹介 Towards a Fair Marketplace: Counterfactual Evaluation of the trade-off between Relevance, Fairness & Satisfaction in Recommendation Systems
hagino3000
1
670
論文紹介 Budget Management Strategies in Repeated Auctions (公開版)
hagino3000
2
330
論文紹介 A Request-level Guaranteed Delivery Advertising Planning: Forecasting and Allocation
hagino3000
1
150
論文紹介 Online Experimentation with Surrogate Metrics Guidelines and a Case Study
hagino3000
1
410
Other Decks in Technology
See All in Technology
スピンアウト講座04_ルーティン処理
overflowinc
0
190
めちゃくちゃ開発するQAエンジニアになって感じたメリットとこれからの課題感
ryuhei0000yamamoto
0
220
Laravelで学ぶOAuthとOpenID Connectの基礎と実装
kyoshidaxx
4
1.5k
Phase05_ClaudeCode入門
overflowinc
0
320
Visional 28新卒プロダクト職(エンジニア/デザイナー)向け 会社説明資料 / Visional Company Briefing for Newgrads 28
visional_engineering_and_design
1
110
TinyTroupeで人狼ゲームやってみた!
ueponx
0
140
visionOS 開発向けの MCP / Skills をつくり続けることで XR の探究と学習を最大化
karad
1
1.2k
A Casual Introduction to RISC-V
omasanori
0
500
頼れる Agentic AI を支える Datadog のオブザーバビリティ / Powering Reliable Agentic AI with Datadog Observability
aoto
PRO
0
240
20260323_データ分析基盤でGeminiを使う話
1210yuichi0
0
120
俺の/私の最強アーキテクチャ決定戦開催 ― チームで新しいアーキテクチャに適合していくために / 20260322 Naoki Takahashi
shift_evolve
PRO
1
350
1GB RAMのラズピッピで何ができるのか試してみよう / 20260319-rpijam-1gb-rpi-whats-possible
akkiesoft
0
650
Featured
See All Featured
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
87
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.5k
How to build a perfect <img>
jonoalderson
1
5.3k
Side Projects
sachag
455
43k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
570
Navigating Weather and Climate Data
rabernat
0
140
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
How GitHub (no longer) Works
holman
316
150k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
160
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
230
Transcript
ষ ઢܗϞσϧ্ͷόϯσΟοτ ػցֶशϓϩϑΣογϣφϧγϦʔζྠಡձ dόϯσΟοτͷཧͱΞϧΰϦζϜ<>d !IBHJOP 5BLBTIJ/JTIJCBZBTIJ <>ʮόϯσΟοτͷཧͱΞϧΰϦζϜʯຊଟ३ʗதଜಞɾஶ
ࣗݾհ ID: hagino3000 Name: ྛ (Takashi Nishibayashi) Job: Software
Engineer ݱࡏΞυωοτϫʔΫࣄۀऀʹͯ৴ޮͷ࠷ దԽʹैࣄ (ೖࡳՁ֨ௐϩδοΫɾࠂબϩ δοΫͷઃܭ͔Β࣮·Ͱ)
ઢܗόϯσΟοτ s t e6 e4 e5 e3 e2 e1 ྫ
࢝T͔ΒऴUʹ͋ΔσʔλʹԿΒ͔ͷ ܦ࿏Λ௨ͯ͠ΞΫηε͢ΔͦΕͧΕͷࢬ FKͰະͷ௨৴ԆВK͕ੜ͡Δ͜ͷ࣌ ʹԿσʔλʹΞΫηεͨ࣌͠ʹཁ͠ ͨ௨৴࣌ؒΛ࠷খԽ͢ΔࣄΛߟ͑Δ
௨৴ωοτϫʔΫͷྫ T͔ΒUͷܦ࿏i㱨\ ʜ ^࣍ͷΑ͏ͳϕΫτϧai 㱨\ ^ͰදΘͤΔɽ ܦ࿏ϕΫτϧશମͷू߹ΛA\ai ^i 㱨\
^Ͱ͋ΒΘ͢ɽ ͜ͷ࣌ɼܦ࿏ai 㱨AΛ༻͍ͨ࣌ͷ௨৴࣌ؒВ В В В 5ʹରͯ͠
ΑΓҰൠతʹ ֤εϩοτϚγϯ͕d ࣍ݩͷϕΫτϧai 㱨A㱬RdʹରԠɽͦͷใु PSଛࣦ ͕ظͷޡ߲ࠩЏ t Λ༻͍ͨઢܗϞσϧ Ͱද͞ΕΔઃఆʹ͓͍ͯྦྷੵใुͷ࠷େԽΛࢦ͢ΛઢܗόϯσΟο τ
MJOFBSCBOEJU ͱΑͿɽ dcAcͰ͋Γ a1 , a2 ,,,a|A| ͕୯ҐߦྻͱͳΔ߹લষ·Ͱͷجຊతͳό ϯσΟοτʹରԠ͢Δɽ ઢܗόϯσΟοτͷจ຺Ͱଟ͘ͷ߹ʹ֤ީิߦಈ BDUJPO ͱΑ ΕΔɽ
ઢܗόϯσΟοτͷSFHSFU ใुظ࠷େͷߦಈ Λબ͠ଓ͚Δ߹ͱൺֱͨ࣌͠ͷଛࣦ 6$#ํࡦΛద༻ͨ͠߹ͷϦάϨοτKcAcʹରͯ͠0 KMPHT ɼcAc͕ ඇৗʹେ͖͘ͳΔ߹ʹผͷํࡦΛߟ͑Δඞཁ͕͋Δɽ
ྫ w 8FCαΠτ࠷దԽ w όϯσΟοτ࠷ద༧ࢉ w ઢܕܭըͷҰ෦ͷ͕ະ w όϯσΟοτઢܗܭը w
ߦಈͷީิcAc㱣
จ຺͖όϯσΟοτ ֤ߦಈͷಛྔ͕ai,t ͱ͍ͬͨܗͰ࣌ࠁʹΑΓҟͳΔΛऔΔ͜ͱΛڐ͢ઃ ఆɽ࠷୯७ͳઃఆͱͯ͠ɼ࣌ࠁUʹԠͨ͡จ຺͕ଘࡏ͢Δͷͷظ࠷େͷ ߦಈ࣌ࠁtʹΑΒͳ͍߹Λߟ͑Δɽ ߦಈͱจ຺ͷަޓ࡞༻ແ͠ˠظ࠷େͷσβΠϯ࣌ࠁtʹґଘ͠ͳ͍ σβΠϯʹΑΔಛྔ ΫϦοΫ ࣌ࠁUʹґଘ͢Δಛྔ ฏPSٳɼϢʔβʔͷྸ
FUDʜ
ߦಈͱจ຺ͷަޓ࡞༻͕͋ΔϞσϧ σβΠϯ͕ύλʔϯ ࣌ࠁUʹґଘ͢ΔϢʔβʔ ͷ͕ύλʔϯͷ߹ 3FHSFU֤࣌ࠁͰৗʹظ࠷େΛͱͬͨ߹ͱͷൺֱ
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ% σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1.
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
-JO6$#ํࡦ ઢܗϞσϧʹର͢Δ6$#ํࡦͰ͋Δ-JO6$#ํࡦ -JO6$#QPMJDZ ֤ߦಈ͝ͱͷ6$#είΞ ͜͜ͰЋt 0 㲋MPH5 Id d
x dͷ୯ҐߦྻɼA-1ߦྻ ͷٯߦྻɽ ޡ߲ࠩͷࢄɼύϥϝʔλ 2 > 0 2 0 , ↵ > 0
-JO6$#ͷ6$#είΞͷߏ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷਪఆ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷඪ४ภࠩ
ઢܗϞσϧ্ͷτϯϓιϯநग़ ਖ਼نϞσϧͰͷࣄޙ֬ͷܭࢉɽ ใुͷޡ߲ࠩЏ U ͕طͷࢄМͷਖ਼نʹै͏߹ Λߟ͑ΔͷВͷࣄޙΛར༻͢ΔͱΞϧΰϦζϜ Вͷࣄޙ͔֬Βαϯϓϧ
ޡ߲͕ࠩਖ਼نͰͳ͍߹ w ΫϦοΫͳͲͷϞσϧͰޡ߲ࠩࢄͱͳΓਖ਼نʹ ैΘͳ͍ w ਖ਼֬ͳࣄޙ͔ΒͷཚੜՄೳ͕ͩܭࢉ͕ඇৗʹෳࡶʹ ͳΔ w τϯϓιϯநग़Ͱਖ਼نΛԾఆͨ͠ΞϧΰϦζϜΛར༻ ͕ͯ͠ԿΒ͔ͷఆ3ʹ͍ͭͯྼΨεతͰ͋Εɼదͳ
МΛऔΔࣄͰখ͞ͳϦάϨοτΛୡͰ͖Δ w ࣮ݧతʹτϯϓιϯநग़-JO6$#ํࡦΑΓΑ͍ੑೳͱͳΔ ߹͕ଟ͍ w ΫϦοΫϞσϧͷΑ͏ʹͰ͋Δ߹ʹྼΨε ͷఆ3Λ༻͍Δͷ͕Ұൠత
࣮ݧͯ͠Έͨ w ࣮ίʔυ w IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT CMPCNBTUFS.-1@CBOEJU$IBQJQZOC w ใुਅͷВͱਅͷࢄ͔Βੜͨ͠ w ޡ߲ࠩͷطͷࢄใुΛճ΄Ͳੜͤͯ͞ಘͨ
w ݁Ռ w ࣮ݧͰ5IPNQTPOநग़ͱ-JO6$#ͷ͕ࠩग़ͣ w ͨͩ͠ࠂ৴ใु͕ͦͷͰ؍ଌͰ͖ͳ͍ͷͰ-JO6$#͑ͳ͍ w 5IPNQTPOநग़ใु͕Εͯͳ͠ w ύϥϝʔλνϡʔχϯά w М ˠВͷࣄલ͕Ͱ͋Δͱߟ͑Δࣄʹ૬
ϩδεςΟοΫճؼϞσϧ্ͷ όϯσΟοτ ใु͕ͷ߹ʹΑΓదͨ͠Ϟσϧɽใु9J U 㱨\ ^ͷ֬ ͷใुΛߟ͑ͨ࣌ͷظ࠷େͷߦಈ Вͷࣄޙ͕ཉ͍͠ ˠਖ਼نͷΑ͏ͳดͨ͡ܗͰ͋ΒΘͤͳ͍ɽ ˠ͜ͷຊͰϥϓϥεۙࣅΛར༻
ˠͰۙࣅ
ϩδεςΟοΫճؼϞσϧ্ͷόϯ σΟοτͷੑೳ w ཧอূແ͍͕࣮༻্༗ޮΒ͍͠ w 4-4DPUU.VMUJBSNFECBOEJUFYQFSJNFOUTJOUIF POMJOFTFSWJDFFDPOPNZ
ใु͕ͷ߹ͷ࣮ݧ w ͔֬ʹଞͷΞϧΰϦζϜΑΓϩδεςΟοΫճؼϞσϧͷ 5IPNQTPOநग़ͷํ͕ੑೳ͕ྑ͍ w -JO6$#ɼใुͷޡ͕ࠩਖ਼نΛաఔͨ͠5IPNQTPOநग़ &QTJMPO(SFFEZΑΓѱ͘ͳͬͨ w ݁Ռϊʔτ IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT
CMPCNBTUFS.-1@CBOEJU$IBQ@CJOBSZ@SFXBSEJQZOC