Slide 1

Slide 1 text

“Online Matching and Ad Allocation”勉強会第4回 Chapter 6 The Online Primal-Dual View 株式会社リクルートコミュニケーションズ ICTソリューション局アドテクノロジーサービス開発部 高柳慎一

Slide 2

Slide 2 text

(C)Recruit Communications Co., Ltd. The Online Primal–Dual View •  これまでは”組み合わせ”の問題として定式化し、 広告のアロケーション問題を解いてきた •  ここではBuchbinder, Naor[22]によって導入さ れたOnline Primal-Dualフレームワークを用いて 解く方法を考える 1

Slide 3

Slide 3 text

(C)Recruit Communications Co., Ltd. 主・双対問題としての定式化 Buchbinderら[21]では主・双対問題の線形計画(LP)として定式化 2 ITC_PPT_C_white_FONTUP.pptx 主問題 双対問題

Slide 4

Slide 4 text

(C)Recruit Communications Co., Ltd. •  オフラインな状況であれば、最適化アロケー ション      についてこれを解けばよい •  実際には全てのV(頂点集合、人)については不明 なので、これはできない •  まずオフラインの解についての条件をチェック 3 主・双対問題としての定式化 x uv ;u ∈U,v ∈ V { }

Slide 5

Slide 5 text

(C)Recruit Communications Co., Ltd. •  線形計画問題において、主・双対問題がそれぞれの問題の最適解 であるための必要十分条件 •  そこから派生し、以下も成立(書籍の式) 相補性条件(Complementary Slackness Condition) 4

Slide 6

Slide 6 text

(C)Recruit Communications Co., Ltd. •  解釈 –      :予算消化されました –            :割当てはScaledなbidが最大 になるよう実施される(双対問題の等号が解なので) –        :割当られた比率は規格化されている 5 相補性条件(Complementary Slackness Condition)

Slide 7

Slide 7 text

(C)Recruit Communications Co., Ltd. オンライン問題における指針 •  LP全体は不明(まだ見ぬvがいる)ので… –  相補性条件の(6.1)を使用して、アロケーション決定 –  良い競合比を持つアロケーションを作成できる •  これをこれからひたすらに見ていく •  手始め、GREEDYの競合比が1/2になることを 見る(with small-bids assumption) 6

Slide 8

Slide 8 text

(C)Recruit Communications Co., Ltd. GREEDYの競合比 7 復習(Chapter 5)

Slide 9

Slide 9 text

(C)Recruit Communications Co., Ltd. GREEDYの競合比(証明) •  以下の一連の(不)等式により明らかになる –  Dual*は条件が全部Givenだと思った時の真の解 –  OPTはsmall-bids仮定の連続極限 –  (一個目の不等式以外は自明かと) 8

Slide 10

Slide 10 text

(C)Recruit Communications Co., Ltd. GREEDYの競合比(証明) •  双対変数の更新法について以下のように定義 –  こうするとアルゴリズムがGREEDYになる –  αは、初期値0で予算消化の際に1とする –  βは最も大きいbidを当てる(テキストの記法が雑) –  割当量は1 9

Slide 11

Slide 11 text

(C)Recruit Communications Co., Ltd. •  双対問題の第二項めで   が加算される •  一方、あるuの予算が消費しつくされた場合、 第一項がBuとなる •  Buは主問題でも既にカウントしてる(二重計算) 10 GREEDYの競合比(証明) 主問題 双対問題

Slide 12

Slide 12 text

(C)Recruit Communications Co., Ltd. MSVV(復習, 5.2, P311) 11 •  同様に、この枠組(双対変数探し)でMSVVを解 釈・表現したい

Slide 13

Slide 13 text

(C)Recruit Communications Co., Ltd. 12 もろもろの定義

Slide 14

Slide 14 text

(C)Recruit Communications Co., Ltd. Primal-Dual Adwords •  このアルゴリズムがMSVVと同じ更新式 –  最大化しているものが同じ(下記参照) 13

Slide 15

Slide 15 text

(C)Recruit Communications Co., Ltd. •  このアルゴリズムの競合比は1/ρ –  .oO(これはMSVVで証明してるので端折る) •  更新時に –  主問題: –  双対問題: だけ目的関数が変化するので、最終的に .oO(等号成立しそうな気がするんだが…) 14 Primal-Dual Adwords

Slide 16

Slide 16 text

(C)Recruit Communications Co., Ltd. 6.2 Adwords with Random Order •  AdversarialではなくRandom到着の場合を検討 •  1-o(1)な競合比の存在について、Devanur and Hayes[35]が以下を提唱 –  LPの頂点集合Vは指定された確率分布でサンプリン グしたものを使う –  (主問題の変数ではなく)双対変数のみを考える 15

Slide 17

Slide 17 text

(C)Recruit Communications Co., Ltd. Random Order Adwords •  ハット付のアルファベットが、サンプリングした問題・LP解いた 結果の変数に相当 •  サンプリングはε個(単位は割合かも?)すると思ってる 16

Slide 18

Slide 18 text

(C)Recruit Communications Co., Ltd. Random Order Adwords •  競合比は下記(証明なし) •  このやり方は実務で使われ得るもの –  Vの分布を過去データから推定してやる •  一般化した手法も[6, 44, 92] 17

Slide 19

Slide 19 text

(C)Recruit Communications Co., Ltd. 6.3 Bipartite Matching via Randomized Primal-Dual •  RANKING for bipartite matching, PERTURBED GREEDY for vertex-weighted bipartite matching に対しても似たような主双対での解釈ができる か? •  違いは予算消化が0, 1だったかそうじゃないか 18

Slide 20

Slide 20 text

(C)Recruit Communications Co., Ltd. •  Algorithm 11との違いは –  乱数を入れるかそうじゃないか •     〜     〜 19 Primal-Dual Vertex-Weighted Bipartite Matching

Slide 21

Slide 21 text

(C)Recruit Communications Co., Ltd. Primal-Dual Vertex-Weighted Bipartite Matching 20

Slide 22

Slide 22 text

(C)Recruit Communications Co., Ltd. •  目的関数がちゃんとPERTURBED GREEDYと 同じになっている •  Primal-Dual ratioの箇所は略 21 Primal-Dual Vertex-Weighted Bipartite Matching

Slide 23

Slide 23 text

(C)Recruit Communications Co., Ltd. •  Feasibility(実行可能性)については議論が必要 –  というランダムネスがあるので •  これに関して期待値をとって成り立つことを証 明[33] •  残りの議論も期待値ベースで成立が言える •  .oO(意味あるのかこれ…) 22 Primal-Dual Vertex-Weighted Bipartite Matching