Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ランダム欠損データに依存しない推薦システムのバイアス除去 / towards-resolving-propensity-contradiction-in-offline-recommender-learning

ランダム欠損データに依存しない推薦システムのバイアス除去 / towards-resolving-propensity-contradiction-in-offline-recommender-learning

Masahiro Nomura

July 02, 2022
Tweet

More Decks by Masahiro Nomura

Other Decks in Research

Transcript

  1. 名前: • 野村 将寛 所属: • CyberAgent AI Lab: Creative

    Research Team 研究: • ハイパーパラメータ最適化 • 進化計算 • ベイズ最適化 • 推薦システム • バンディット • ⾃然⾔語処理 2 ⾃⼰紹介
  2. Towards Resolving Propensity Contradiction in Offline Recommender Learning Yuta Saito

    (Cornell) and Masahiro Nomura (CyberAgent) IJCAI’22 (Long Talk) Acceptance rate=15%, Long Talk (top 4% of submissions) 3
  3. 真の評価分布と観測される評価分布のズレ 6 選択バイアス • 過去の推薦⽅法 • ユーザの選択⾏動 真の評価分布 (Marlin et

    al., UAIʼ07) Figure 2. Marlin, B., Zemel, R. S., Roweis, S., and Slaney, M. Collaborative filtering and the missing at random assumption. In UAI, 2007. 観測された評価分布
  4. 傾向スコアの推定とその⽭盾 14 IPS推定量には傾向スコアの推定が必要 • しかし,真の傾向スコアは実⽤上⼿に⼊らない 既存研究では傾向スコアを⼗分に推定するため,真の分布からのランダムな (Missing-completely-at-random; MCAR) データを必要としている •

    元々はMCARデータを使わずにうまく推定するのが⽬的だった • モチベーションと⽭盾することが起こっている 傾向スコアに依存しない形で正確な評価予測器を学習することは可能だろうか︖
  5. 実験: ⽐較⼿法 ⾏列分解を以下の損失関数によって最適化: • ナイーブ損失 • IPS損失 [Schnabel et al.2016]

    • Doubly Robust(DR)損失 [Wang et al.2019] • CauseE [Bonner and Vasile.2018] • DAMF (our proposal) 20 傾向スコアが必要 MCARデータが必要& 理論的解釈が困難 傾向スコアは不必要 & 理論的妥当性を有する