Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Online Matching and Ad Allocation [Chapter 6 Th...
Search
Shinichi Takayanagi
May 24, 2016
Technology
0
240
Online Matching and Ad Allocation [Chapter 6 The Online Primal-Dual View]
“Online Matching and Ad Allocation”勉強会第4回の「Chapter 6
The Online Primal-Dual View」のまとめ資料
Shinichi Takayanagi
May 24, 2016
Tweet
Share
More Decks by Shinichi Takayanagi
See All by Shinichi Takayanagi
バイブコーディングの正体——AIエージェントはソフトウェア開発を変えるか?
stakaya
5
970
[NeurIPS 2023 論文読み会] Wasserstein Quantum Monte Carlo
stakaya
0
530
[KDD2021 論文読み会] ControlBurn: Feature Selection by Sparse Forests
stakaya
2
1.9k
[ICML2021 論文読み会] Mandoline: Model Evaluation under Distribution Shift
stakaya
0
2k
[情報検索/推薦 各社合同 論文読み祭 #1] KDD ‘20 "Embedding-based Retrieval in Facebook Search"
stakaya
2
610
【2020年新人研修資料】ナウでヤングなPython開発入門
stakaya
29
21k
論文読んだ「Simple and Deterministic Matrix Sketching」
stakaya
1
1.2k
Quick Introduction to Approximate Bayesian Computation (ABC) with R"
stakaya
3
340
The Road to Machine Learning Engineer from Data Scientist
stakaya
5
4.4k
Other Decks in Technology
See All in Technology
あとはAIに任せて人間は自由に生きる
kentaro
3
860
いま、あらためて考えてみるアカウント管理 with IaC / Account management with IaC
kohbis
2
480
Infrastructure as Prompt実装記 〜Bedrock AgentCoreで作る自然言語インフラエージェント〜
yusukeshimizu
2
170
アカデミーキャンプ 2025 SuuuuuuMMeR「燃えろ!!ロボコン」 / Academy Camp 2025 SuuuuuuMMeR "Burn the Spirit, Robocon!!" DAY 1
ks91
PRO
0
150
あなたの知らない OneDrive
murachiakira
0
160
Amazon Bedrock AgentCore でプロモーション用動画生成エージェントを開発する
nasuvitz
6
310
20250818_KGX・One Hokkaidoコラボイベント
tohgeyukihiro
0
120
LLM時代の検索とコンテキストエンジニアリング
shibuiwilliam
2
950
人を動かすことについて考える
ichimichi
2
190
サービスロボット最前線:ugoが挑むPhysical AI活用
kmatsuiugo
0
170
夢の印税生活 / Life on Royalties
tmtms
0
200
PFEM Online Feature Flag @ newmo
shinyaishitobi
2
190
Featured
See All Featured
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
BBQ
matthewcrist
89
9.8k
Rails Girls Zürich Keynote
gr2m
95
14k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.8k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
358
30k
Designing Experiences People Love
moore
142
24k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
[RailsConf 2023] Rails as a piece of cake
palkan
56
5.8k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
Transcript
“Online Matching and Ad Allocation”勉強会第4回 Chapter 6 The Online Primal-Dual
View 株式会社リクルートコミュニケーションズ ICTソリューション局アドテクノロジーサービス開発部 高柳慎一
(C)Recruit Communications Co., Ltd. The Online Primal–Dual View • これまでは”組み合わせ”の問題として定式化し、
広告のアロケーション問題を解いてきた • ここではBuchbinder, Naor[22]によって導入さ れたOnline Primal-Dualフレームワークを用いて 解く方法を考える 1
(C)Recruit Communications Co., Ltd. 主・双対問題としての定式化 Buchbinderら[21]では主・双対問題の線形計画(LP)として定式化 2 ITC_PPT_C_white_FONTUP.pptx 主問題 双対問題
(C)Recruit Communications Co., Ltd. • オフラインな状況であれば、最適化アロケー ション についてこれを解けばよい • 実際には全てのV(頂点集合、人)については不明 なので、これはできない
• まずオフラインの解についての条件をチェック 3 主・双対問題としての定式化 x uv ;u ∈U,v ∈ V { }
(C)Recruit Communications Co., Ltd. • 線形計画問題において、主・双対問題がそれぞれの問題の最適解 であるための必要十分条件 • そこから派生し、以下も成立(書籍の式) 相補性条件(Complementary
Slackness Condition) 4
(C)Recruit Communications Co., Ltd. • 解釈 – :予算消化されました – :割当てはScaledなbidが最大
になるよう実施される(双対問題の等号が解なので) – :割当られた比率は規格化されている 5 相補性条件(Complementary Slackness Condition)
(C)Recruit Communications Co., Ltd. オンライン問題における指針 • LP全体は不明(まだ見ぬvがいる)ので… – 相補性条件の(6.1)を使用して、アロケーション決定 –
良い競合比を持つアロケーションを作成できる • これをこれからひたすらに見ていく • 手始め、GREEDYの競合比が1/2になることを 見る(with small-bids assumption) 6
(C)Recruit Communications Co., Ltd. GREEDYの競合比 7 復習(Chapter 5)
(C)Recruit Communications Co., Ltd. GREEDYの競合比(証明) • 以下の一連の(不)等式により明らかになる – Dual*は条件が全部Givenだと思った時の真の解 –
OPTはsmall-bids仮定の連続極限 – (一個目の不等式以外は自明かと) 8
(C)Recruit Communications Co., Ltd. GREEDYの競合比(証明) • 双対変数の更新法について以下のように定義 – こうするとアルゴリズムがGREEDYになる –
αは、初期値0で予算消化の際に1とする – βは最も大きいbidを当てる(テキストの記法が雑) – 割当量は1 9
(C)Recruit Communications Co., Ltd. • 双対問題の第二項めで が加算される • 一方、あるuの予算が消費しつくされた場合、 第一項がBuとなる
• Buは主問題でも既にカウントしてる(二重計算) 10 GREEDYの競合比(証明) 主問題 双対問題
(C)Recruit Communications Co., Ltd. MSVV(復習, 5.2, P311) 11 • 同様に、この枠組(双対変数探し)でMSVVを解
釈・表現したい
(C)Recruit Communications Co., Ltd. 12 もろもろの定義
(C)Recruit Communications Co., Ltd. Primal-Dual Adwords • このアルゴリズムがMSVVと同じ更新式 – 最大化しているものが同じ(下記参照)
13
(C)Recruit Communications Co., Ltd. • このアルゴリズムの競合比は1/ρ – .oO(これはMSVVで証明してるので端折る) • 更新時に
– 主問題: – 双対問題: だけ目的関数が変化するので、最終的に .oO(等号成立しそうな気がするんだが…) 14 Primal-Dual Adwords
(C)Recruit Communications Co., Ltd. 6.2 Adwords with Random Order •
AdversarialではなくRandom到着の場合を検討 • 1-o(1)な競合比の存在について、Devanur and Hayes[35]が以下を提唱 – LPの頂点集合Vは指定された確率分布でサンプリン グしたものを使う – (主問題の変数ではなく)双対変数のみを考える 15
(C)Recruit Communications Co., Ltd. Random Order Adwords • ハット付のアルファベットが、サンプリングした問題・LP解いた 結果の変数に相当
• サンプリングはε個(単位は割合かも?)すると思ってる 16
(C)Recruit Communications Co., Ltd. Random Order Adwords • 競合比は下記(証明なし) •
このやり方は実務で使われ得るもの – Vの分布を過去データから推定してやる • 一般化した手法も[6, 44, 92] 17
(C)Recruit Communications Co., Ltd. 6.3 Bipartite Matching via Randomized Primal-Dual
• RANKING for bipartite matching, PERTURBED GREEDY for vertex-weighted bipartite matching に対しても似たような主双対での解釈ができる か? • 違いは予算消化が0, 1だったかそうじゃないか 18
(C)Recruit Communications Co., Ltd. • Algorithm 11との違いは – 乱数を入れるかそうじゃないか •
〜 〜 19 Primal-Dual Vertex-Weighted Bipartite Matching
(C)Recruit Communications Co., Ltd. Primal-Dual Vertex-Weighted Bipartite Matching 20
(C)Recruit Communications Co., Ltd. • 目的関数がちゃんとPERTURBED GREEDYと 同じになっている • Primal-Dual
ratioの箇所は略 21 Primal-Dual Vertex-Weighted Bipartite Matching
(C)Recruit Communications Co., Ltd. • Feasibility(実行可能性)については議論が必要 – というランダムネスがあるので • これに関して期待値をとって成り立つことを証
明[33] • 残りの議論も期待値ベースで成立が言える • .oO(意味あるのかこれ…) 22 Primal-Dual Vertex-Weighted Bipartite Matching