論文紹介/Predicting Online Performance of News Recommender Systems

Predic'ng Online Performance of News Recommender Systems Through Richer Evelua'on
Metrics (Recsys 2015) Andrii Maksai, Florent Garcin, Boi Fal'ngs Ar'ﬁcaial Intelligence Lab, Switzerland Yoshifumi Seki Gunosyデータマイニング研究会 2015.12.09

概要 •  ニュース推薦の構築に関する論文 •  多くの推薦評価指標について – 各指標内、指標間の相関について – 指標が実際の成果(CTR)に与える影響について •  アルゴリズムのチューニングについて • 
オフラインのデータからオンラインの結果をどのように予測するか

様々な推薦システムの指標 •  Accuracy –  RMSEとか, MAEとか, F値とか •  Diversity – 
多様性 •  Novelty –  ユーザに取って新しいアイテムをどれだけ提示できるか •  Coverage –  商品をどれだけカバーできるか •  Serendipity –  意外性

評価指標の相関 •  各カテゴリ内のさまざまな指標は相関していた – すべてを満足させる必要はなく，ひとつ代表するものを得ればよい •  カテゴリ間では相関してない

記事リストの長さによる依存 •  記事リストの長さによって相関の度合いは変わってくる

Metric trade-oﬀ

Predic'ng online from oﬄine •  Oﬄine Accuracy – 推薦システムが存在しない状況で生成されたクリックログから予測されたクリック率 • 
Online Accuracy – 推薦システムが稼働している状況でのクリック率

Feature Selec'on •  Least Angle Regression •  各Featureが線形に作用してるという仮定 – L1正規化 • 
これを用いて各Metricsがどの程度CTRに反映させているかを測る y = T x + n X j=1 | xj |

Feature Selec'on

Regression model •  MetricsからCTRを予測するモデルができた – 各Metrics間のTrade-oﬀがわかる – Metricsがどのように寄与するかがわかる

Self adjust algorithm blend

Dataset[SwissInfo] •  Swissinfo.ch – ニュースサイト •  Oﬄine data – 227k clicks, 28,525
stories, 118k users •  Online data – 3つの推薦システムの動作時のログ •  直近200記事クリックを使って推薦 – 3週間 – 168k click

Dataset[Yahoo Front Page] •  15日間のYahooTopPageでのクリックデータ[Li +2011] •  ページへの滞在が2値ベクトルとして記載, 20 アイテムが推薦されている
•  28M visit 653 items – 同じようなセッションを統合して5.7M click

Dataset[LePoint] •  3.5 days – 4.6M clicks and 3.3M users

Feature Selec'on

CTR Predic'on

Online Accuracy Predic'on

Algorithm Blending

論文紹介/Predicting Online Performance of News Reco...

論文紹介/Predicting Online Performance of News Recommender Systems

ysekky

More Decks by ysekky

Other Decks in Research

Featured

Transcript

Predic'ng Online Performance of News Recommender Systems Through Richer Evelua'on

概要 •  ニュース推薦の構築に関する論文 •  多くの推薦評価指標について – 各指標内、指標間の相関について – 指標が実際の成果(CTR)に与える影響について •  アルゴリズムのチューニングについて •

様々な推薦システムの指標 •  Accuracy –  RMSEとか, MAEとか, F値とか •  Diversity –

評価指標の相関 •  各カテゴリ内のさまざまな指標は相関していた – すべてを満足させる必要はなく，ひとつ代表するものを得ればよい •  カテゴリ間では相関してない

記事リストの長さによる依存 •  記事リストの長さによって相関の度合いは変わってくる

Metric trade-oﬀ

Predic'ng online from oﬄine •  Oﬄine Accuracy – 推薦システムが存在しない状況で生成されたクリックログから予測されたクリック率 •

Feature Selec'on •  Least Angle Regression •  各Featureが線形に作用してるという仮定 – L1正規化 •

Feature Selec'on

Regression model •  MetricsからCTRを予測するモデルができた – 各Metrics間のTrade-oﬀがわかる – Metricsがどのように寄与するかがわかる

Self adjust algorithm blend

Dataset[SwissInfo] •  Swissinfo.ch – ニュースサイト •  Oﬄine data – 227k clicks, 28,525

Dataset[Yahoo Front Page] •  15日間のYahooTopPageでのクリックデータ[Li +2011] •  ページへの滞在が2値ベクトルとして記載, 20 アイテムが推薦されている

Dataset[LePoint] •  3.5 days – 4.6M clicks and 3.3M users

Feature Selec'on

CTR Predic'on

Online Accuracy Predic'on

Algorithm Blending