論文紹介/Predicting Online Performance of News Recommender Systems

D490d541e3d1ab04d5203e8b210b2233?s=47 ysekky
December 22, 2015

論文紹介/Predicting Online Performance of News Recommender Systems

D490d541e3d1ab04d5203e8b210b2233?s=128

ysekky

December 22, 2015
Tweet

Transcript

  1. Predic'ng Online Performance of News Recommender Systems Through Richer Evelua'on

    Metrics (Recsys 2015) Andrii Maksai, Florent Garcin, Boi Fal'ngs Ar'ficaial Intelligence Lab, Switzerland Yoshifumi Seki Gunosyデータマイニング研究会 2015.12.09
  2. 概要 •  ニュース推薦の構築に関する論文 •  多くの推薦評価指標について – 各指標内、指標間の相関について – 指標が実際の成果(CTR)に与える影響について •  アルゴリズムのチューニングについて • 

    オフラインのデータからオンラインの結果をど のように予測するか
  3. 様々な推薦システムの指標 •  Accuracy –  RMSEとか, MAEとか, F値とか •  Diversity – 

    多様性 •  Novelty –  ユーザに取って新しいアイテムをどれだけ提示できるか •  Coverage –  商品をどれだけカバーできるか •  Serendipity –  意外性
  4. 評価指標の相関 •  各カテゴリ内のさまざまな指標は相関してい た – すべてを満足させる必要はなく,ひとつ代表する ものを得ればよい •  カテゴリ間では相関してない

  5. 記事リストの長さによる依存 •  記事リストの長さによって相関の度合いは変 わってくる

  6. Metric trade-off

  7. Predic'ng online from offline •  Offline Accuracy – 推薦システムが存在しない状況で生成されたク リックログから予測されたクリック率 • 

    Online Accuracy – 推薦システムが稼働している状況でのクリック率
  8. Feature Selec'on •  Least Angle Regression •  各Featureが線形に作用してるという仮定 – L1正規化 • 

    これを用いて各Metricsがどの程度CTRに反映 させているかを測る y = T x + n X j=1 | xj |
  9. Feature Selec'on

  10. Regression model •  MetricsからCTRを予測するモデルができた – 各Metrics間のTrade-offがわかる – Metricsがどのように寄与するかがわかる

  11. Self adjust algorithm blend

  12. Dataset[SwissInfo] •  Swissinfo.ch – ニュースサイト •  Offline data – 227k clicks, 28,525

    stories, 118k users •  Online data – 3つの推薦システムの動作時のログ •  直近200記事クリックを使って推薦 – 3週間 – 168k click
  13. Dataset[Yahoo Front Page] •  15日間のYahooTopPageでのクリックデータ[Li +2011] •  ページへの滞在が2値ベクトルとして記載, 20 アイテムが推薦されている

    •  28M visit 653 items – 同じようなセッションを統合して5.7M click
  14. Dataset[LePoint] •  3.5 days – 4.6M clicks and 3.3M users

  15. Feature Selec'on

  16. CTR Predic'on

  17. Online Accuracy Predic'on

  18. Algorithm Blending