Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Online Matching and Ad Allocation [Chapter 6 The Online Primal-Dual View]

Online Matching and Ad Allocation [Chapter 6 The Online Primal-Dual View]

“Online Matching and Ad Allocation”勉強会第4回の「Chapter 6
The Online Primal-Dual View」のまとめ資料

8a7e83d2e447783ab6d824f553429a09?s=128

Shinichi Takayanagi

May 24, 2016
Tweet

Transcript

  1. “Online Matching and Ad Allocation”勉強会第4回 Chapter 6 The Online Primal-Dual

    View 株式会社リクルートコミュニケーションズ ICTソリューション局アドテクノロジーサービス開発部 高柳慎一
  2. (C)Recruit Communications Co., Ltd. The Online Primal–Dual View •  これまでは”組み合わせ”の問題として定式化し、

    広告のアロケーション問題を解いてきた •  ここではBuchbinder, Naor[22]によって導入さ れたOnline Primal-Dualフレームワークを用いて 解く方法を考える 1
  3. (C)Recruit Communications Co., Ltd. 主・双対問題としての定式化 Buchbinderら[21]では主・双対問題の線形計画(LP)として定式化 2 ITC_PPT_C_white_FONTUP.pptx 主問題 双対問題

  4. (C)Recruit Communications Co., Ltd. •  オフラインな状況であれば、最適化アロケー ション      についてこれを解けばよい •  実際には全てのV(頂点集合、人)については不明 なので、これはできない

    •  まずオフラインの解についての条件をチェック 3 主・双対問題としての定式化 x uv ;u ∈U,v ∈ V { }
  5. (C)Recruit Communications Co., Ltd. •  線形計画問題において、主・双対問題がそれぞれの問題の最適解 であるための必要十分条件 •  そこから派生し、以下も成立(書籍の式) 相補性条件(Complementary

    Slackness Condition) 4
  6. (C)Recruit Communications Co., Ltd. •  解釈 –      :予算消化されました –            :割当てはScaledなbidが最大

    になるよう実施される(双対問題の等号が解なので) –        :割当られた比率は規格化されている 5 相補性条件(Complementary Slackness Condition)
  7. (C)Recruit Communications Co., Ltd. オンライン問題における指針 •  LP全体は不明(まだ見ぬvがいる)ので… –  相補性条件の(6.1)を使用して、アロケーション決定 – 

    良い競合比を持つアロケーションを作成できる •  これをこれからひたすらに見ていく •  手始め、GREEDYの競合比が1/2になることを 見る(with small-bids assumption) 6
  8. (C)Recruit Communications Co., Ltd. GREEDYの競合比 7 復習(Chapter 5)

  9. (C)Recruit Communications Co., Ltd. GREEDYの競合比(証明) •  以下の一連の(不)等式により明らかになる –  Dual*は条件が全部Givenだと思った時の真の解 – 

    OPTはsmall-bids仮定の連続極限 –  (一個目の不等式以外は自明かと) 8
  10. (C)Recruit Communications Co., Ltd. GREEDYの競合比(証明) •  双対変数の更新法について以下のように定義 –  こうするとアルゴリズムがGREEDYになる – 

    αは、初期値0で予算消化の際に1とする –  βは最も大きいbidを当てる(テキストの記法が雑) –  割当量は1 9
  11. (C)Recruit Communications Co., Ltd. •  双対問題の第二項めで   が加算される •  一方、あるuの予算が消費しつくされた場合、 第一項がBuとなる

    •  Buは主問題でも既にカウントしてる(二重計算) 10 GREEDYの競合比(証明) 主問題 双対問題
  12. (C)Recruit Communications Co., Ltd. MSVV(復習, 5.2, P311) 11 •  同様に、この枠組(双対変数探し)でMSVVを解

    釈・表現したい
  13. (C)Recruit Communications Co., Ltd. 12 もろもろの定義

  14. (C)Recruit Communications Co., Ltd. Primal-Dual Adwords •  このアルゴリズムがMSVVと同じ更新式 –  最大化しているものが同じ(下記参照)

    13
  15. (C)Recruit Communications Co., Ltd. •  このアルゴリズムの競合比は1/ρ –  .oO(これはMSVVで証明してるので端折る) •  更新時に

    –  主問題: –  双対問題: だけ目的関数が変化するので、最終的に .oO(等号成立しそうな気がするんだが…) 14 Primal-Dual Adwords
  16. (C)Recruit Communications Co., Ltd. 6.2 Adwords with Random Order • 

    AdversarialではなくRandom到着の場合を検討 •  1-o(1)な競合比の存在について、Devanur and Hayes[35]が以下を提唱 –  LPの頂点集合Vは指定された確率分布でサンプリン グしたものを使う –  (主問題の変数ではなく)双対変数のみを考える 15
  17. (C)Recruit Communications Co., Ltd. Random Order Adwords •  ハット付のアルファベットが、サンプリングした問題・LP解いた 結果の変数に相当

    •  サンプリングはε個(単位は割合かも?)すると思ってる 16
  18. (C)Recruit Communications Co., Ltd. Random Order Adwords •  競合比は下記(証明なし) • 

    このやり方は実務で使われ得るもの –  Vの分布を過去データから推定してやる •  一般化した手法も[6, 44, 92] 17
  19. (C)Recruit Communications Co., Ltd. 6.3 Bipartite Matching via Randomized Primal-Dual

    •  RANKING for bipartite matching, PERTURBED GREEDY for vertex-weighted bipartite matching に対しても似たような主双対での解釈ができる か? •  違いは予算消化が0, 1だったかそうじゃないか 18
  20. (C)Recruit Communications Co., Ltd. •  Algorithm 11との違いは –  乱数を入れるかそうじゃないか • 

       〜     〜 19 Primal-Dual Vertex-Weighted Bipartite Matching
  21. (C)Recruit Communications Co., Ltd. Primal-Dual Vertex-Weighted Bipartite Matching 20

  22. (C)Recruit Communications Co., Ltd. •  目的関数がちゃんとPERTURBED GREEDYと 同じになっている •  Primal-Dual

    ratioの箇所は略 21 Primal-Dual Vertex-Weighted Bipartite Matching
  23. (C)Recruit Communications Co., Ltd. •  Feasibility(実行可能性)については議論が必要 –  というランダムネスがあるので •  これに関して期待値をとって成り立つことを証

    明[33] •  残りの議論も期待値ベースで成立が言える •  .oO(意味あるのかこれ…) 22 Primal-Dual Vertex-Weighted Bipartite Matching