Addressing Trust Bias for Unbiased Learning-to-Rank@MLPRP#3

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

© So-net Media Networks Corporation. 3 検索クエリに対し最適なドキュメントのランキングを返したい例）ある検索クエリに対して10個のdocumentを表⽰するとき Position (k) Ranking 1 Ranking 2 1 5 1 2 4 2 --- --- --- 9 1 5 10 2 4 Ranking 1のように関連度の⾼いdocumentを上位に表⽰したい (5段階の関連度) ランキング学習とは

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

© So-net Media Networks Corporation. 8 ある検索クエリに対して10個のdocumentを表⽰したとき Position (k) Relevance ??? Click 1 ◎ ◎ 2 × × --- --- --- --- 9 ◎ × 10 × × 必ずしも Relevance = Click とは⾔えなさそう... ClickはRelevanceの代わりになる︖

Slide 9

Slide 9 text

Slide 10

Slide 10 text

© So-net Media Networks Corporation. 10 ClickとRelevanceを関係付けるため次のPosition-Based Modelを導⼊このモデル化のもとでは、 • queryとdocumentがrelevantかつexaminedのときclickが発⽣ • Relevanceはqueryとdocumentのみに依存 • Examinationはpositionのみに依存 Examination Relevance Click Position-Based Model (PBM)

Slide 11

Slide 11 text

© So-net Media Networks Corporation. 11 ある検索クエリに対して10個のdocumentを表⽰したとき Position (k) Relevance Examine Click 1 ◎ ◎ ◎ 2 × ◎ × --- --- --- --- 9 ◎ × × 10 × × × RelevanceとExaminationの両⽅が発⽣して初めてClickが発⽣ Position-Based Model (PBM)

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

© So-net Media Networks Corporation. 16 WSDM2017で枠組みが提案されて以降、PBMのモデル化のもとで Examination確率をいかに推定するかが研究の主な焦点 • Result Randomization [Joachims et al. WSDM2017] • ランダムなランキング表⽰データを⽤いて推定 • Regression-EM [Wang et al. WSDM2018] • ランダム配信なしでパラメータをEM-basedな⼿法で推定 • Intervention-Harvesting [Wang et al. WSDM2019] • Relevanceモデルをexamination parameterの推定時に必要としない関連研究

Slide 17

Slide 17 text

© So-net Media Networks Corporation. 17 そのほかの研究も、PBMのモデルを前提とした研究 • Dual Learning Algorithm (前回発表) [Ai et al. SIGIR2018] • RelevanceとExaminationのunbiasedなlossを相互依存する形で最適化 • Unbiased LambdaMART [Hu et al. WWW2019] • Inverse Propensity ScoreをPairwise lossに拡張 • Context Dependent Examination Bias [Fang et al. SIGIR2019] • Examination確率がcontextにも依存するというモデル化関連研究

Slide 18

Slide 18 text

Slide 19

Slide 19 text

© So-net Media Networks Corporation. 19 • グループ︓Cornell Univ. と Google Research • 学会︓WWWʼ19 • サマリー • Clickデータのみを⽤いてRelevanceを予測する分野 • これまではシンプルなモデルに基づいた⼿法が主要であり、誤クリック率を考慮に⼊れていなかった • ポジションに依存する誤クリックパラメータを含めたモデル化を提案（これまでの単純なPBMを現実的な仮定に修正）メタ情報・サマリー

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

© So-net Media Networks Corporation. 27 Regression EM (PBM ver.) 3 E-step 6 E-stepの推定に基づき Relevanceラベルをサンプリング 9 query-documentのcontext からGBDTでfitting 10 examination paramは通常のM-stepで更新 11 relevance paramは GBDTの出⼒で更新 [Wang et al. (2018)]のAlgorithm 1を引⽤

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

© So-net Media Networks Corporation. 35 [Joachims et al. WSDM2017]: Thorsten Joachims, Adith Swaminathan, and Tobias Schnabel. 2017. Unbiased learning-to-rank with biased feedback. In Proceedings of the 10th ACM International Conference on Web Search and Data Mining (WSDM ʼ17). [Wang et al. WSDM2018]: Xuanhui Wang, Nadav Golbandi, Michael Bendersky, Donald Metzler, and Marc Najork. 2018. Position Bias Estimation for Unbiased Learning to Rank in Personal Search. In Proceedings of the 11th ACM International Conference on Web Search and Data Mining (WSDM ʼ18). [Ai et al. SIGIR2018]: Qingyao Ai, Keping Bi, Cheng Luo, Jiafeng Guo, and W. Bruce Croft. Unbiased learning to rank with unbiased propensity estimation. In The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval (SIGIRʼ18). [Agarwal et al. WSDM2019]: Aman Agarwal, Ivan Zaitsev, Xuanhui Wang, Cheng Li, Marc Najork and Thorsten Joachims. 2019. Estimating Position Bias without Intrusive Interventions. In The 12th ACM International Conference on Web Search and Data Mining (WSDM ʼ19) [Hu et al. WWW2019]: Ziniu Hu and Yang Wang, Qu Peng, Hang Li. 2019. Unbiased LambdaMART: An Unbiased Pairwise Learning- to-Rank Algorithm. In Proceedings of the 2019 World Wide Web Conference (WWW ʼ19) [Agarwal et al. WWW2019]: Aman Agarwal, Xuanhui Wang, Cheng Li, Mike Bendersky, and Marc Najork. 2019. Addressing Trust Bias for Unbiased Learning-to-Rank. In Proceedings of the 2019 World Wide Web Conference (WWW ʼ19) [Fang et al. SIGIR2019] Fang, Z., Agarwal, A., and Joachims, T. Intervention harvesting for context-dependent examination-bias estimation. arXiv preprint arXiv:1811.01802, 2018. References