Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介/Predicting Online Performance of News Recommender Systems
Search
ysekky
December 22, 2015
Research
0
280
論文紹介/Predicting Online Performance of News Recommender Systems
ysekky
December 22, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
1.7k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.4k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
1.8k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
700
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.4k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.2k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
840
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.1k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.7k
Other Decks in Research
See All in Research
推薦結果への説明付加はいつどんなものが嬉しいか
kuri8ive
1
220
メタ動画データセットによる動作認識の現状と可能性
yuyay
0
120
Rの機械学習フレームワークの紹介〜tidymodelsを中心に〜 / machine_learning_with_r2024
s_uryu
0
190
The Theory behind Vector DB
matsui_528
0
340
フルリモートワークでのスクラムのスケール
kmorita1111
2
960
Alexander Mielke Hellinger--Kantorovich (a.k.a. Wasserstein-Fisher-Rao) Spaces and Gradient Flows
jjzhu
3
150
音声処理ツールキットESPnetの現在と未来
kanbayashi1125
2
480
20240127_熊本から今いちど真面目に都市交通~めざせ「車1割削減、渋滞半減、公共交通2倍」~ 全国路面電車サミット2024宇都宮
trafficbrain
1
600
F0に基づいて伸縮された画像文字からの音声合成 [ASJ2024春]
nehi0615
0
110
データで診て考える合志市の渋滞と公共交通 ~めざせ 車1割削減、渋滞半減、公共交通2倍~
trafficbrain
0
440
CoRL2023速報
rpc
1
1.9k
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
130
Featured
See All Featured
Designing the Hi-DPI Web
ddemaree
275
33k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3k
The Pragmatic Product Professional
lauravandoore
24
5.7k
Embracing the Ebb and Flow
colly
78
4.1k
Become a Pro
speakerdeck
PRO
8
4.4k
Bash Introduction
62gerente
604
210k
Principles of Awesome APIs and How to Build Them.
keavy
119
16k
BBQ
matthewcrist
78
8.7k
The Language of Interfaces
destraynor
150
23k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
34
8.8k
It's Worth the Effort
3n
180
27k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
19
1.6k
Transcript
Predic'ng Online Performance of News Recommender Systems Through Richer Evelua'on
Metrics (Recsys 2015) Andrii Maksai, Florent Garcin, Boi Fal'ngs Ar'ficaial Intelligence Lab, Switzerland Yoshifumi Seki Gunosyデータマイニング研究会 2015.12.09
概要 • ニュース推薦の構築に関する論文 • 多くの推薦評価指標について – 各指標内、指標間の相関について – 指標が実際の成果(CTR)に与える影響について • アルゴリズムのチューニングについて •
オフラインのデータからオンラインの結果をど のように予測するか
様々な推薦システムの指標 • Accuracy – RMSEとか, MAEとか, F値とか • Diversity –
多様性 • Novelty – ユーザに取って新しいアイテムをどれだけ提示できるか • Coverage – 商品をどれだけカバーできるか • Serendipity – 意外性
評価指標の相関 • 各カテゴリ内のさまざまな指標は相関してい た – すべてを満足させる必要はなく,ひとつ代表する ものを得ればよい • カテゴリ間では相関してない
記事リストの長さによる依存 • 記事リストの長さによって相関の度合いは変 わってくる
Metric trade-off
Predic'ng online from offline • Offline Accuracy – 推薦システムが存在しない状況で生成されたク リックログから予測されたクリック率 •
Online Accuracy – 推薦システムが稼働している状況でのクリック率
Feature Selec'on • Least Angle Regression • 各Featureが線形に作用してるという仮定 – L1正規化 •
これを用いて各Metricsがどの程度CTRに反映 させているかを測る y = T x + n X j=1 | xj |
Feature Selec'on
Regression model • MetricsからCTRを予測するモデルができた – 各Metrics間のTrade-offがわかる – Metricsがどのように寄与するかがわかる
Self adjust algorithm blend
Dataset[SwissInfo] • Swissinfo.ch – ニュースサイト • Offline data – 227k clicks, 28,525
stories, 118k users • Online data – 3つの推薦システムの動作時のログ • 直近200記事クリックを使って推薦 – 3週間 – 168k click
Dataset[Yahoo Front Page] • 15日間のYahooTopPageでのクリックデータ[Li +2011] • ページへの滞在が2値ベクトルとして記載, 20 アイテムが推薦されている
• 28M visit 653 items – 同じようなセッションを統合して5.7M click
Dataset[LePoint] • 3.5 days – 4.6M clicks and 3.3M users
Feature Selec'on
CTR Predic'on
Online Accuracy Predic'on
Algorithm Blending