Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介/Predicting Online Performance of News Reco...
Search
ysekky
December 22, 2015
Research
0
340
論文紹介/Predicting Online Performance of News Recommender Systems
ysekky
December 22, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.6k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
750
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.7k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.4k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.1k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.2k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.9k
Other Decks in Research
See All in Research
機械学習でヒトの行動を変える
hiromu1996
1
550
Weekly AI Agents News! 11月号 プロダクト/ニュースのアーカイブ
masatoto
0
300
Weekly AI Agents News! 11月号 論文のアーカイブ
masatoto
0
300
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1.3k
ナレッジプロデューサーとしてのミドルマネージャー支援 - MIMIGURI「知識創造室」の事例の考察 -
chiemitaki
0
220
Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping
satai
3
140
PhD Defence: Considering Temporal and Contextual Information for Lexical Semantic Change Detection
a1da4
0
120
リモートワークにおけるパッシブ疲労
matsumoto_r
PRO
6
5k
o1 pro mode の調査レポート
smorce
0
120
Weekly AI Agents News! 1月号 アーカイブ
masatoto
1
170
[輪講] Transformer Layers as Painters
nk35jk
4
680
Tiaccoon: コンテナネットワークにおいて複数トランスポート方式で統一的なアクセス制御
hiroyaonoe
0
420
Featured
See All Featured
BBQ
matthewcrist
87
9.5k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
4
360
Large-scale JavaScript Application Architecture
addyosmani
511
110k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
4 Signs Your Business is Dying
shpigford
182
22k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
40
2k
Automating Front-end Workflow
addyosmani
1368
200k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Designing for humans not robots
tammielis
250
25k
Thoughts on Productivity
jonyablonski
69
4.5k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
193
16k
Transcript
Predic'ng Online Performance of News Recommender Systems Through Richer Evelua'on
Metrics (Recsys 2015) Andrii Maksai, Florent Garcin, Boi Fal'ngs Ar'ficaial Intelligence Lab, Switzerland Yoshifumi Seki Gunosyデータマイニング研究会 2015.12.09
概要 • ニュース推薦の構築に関する論文 • 多くの推薦評価指標について – 各指標内、指標間の相関について – 指標が実際の成果(CTR)に与える影響について • アルゴリズムのチューニングについて •
オフラインのデータからオンラインの結果をど のように予測するか
様々な推薦システムの指標 • Accuracy – RMSEとか, MAEとか, F値とか • Diversity –
多様性 • Novelty – ユーザに取って新しいアイテムをどれだけ提示できるか • Coverage – 商品をどれだけカバーできるか • Serendipity – 意外性
評価指標の相関 • 各カテゴリ内のさまざまな指標は相関してい た – すべてを満足させる必要はなく,ひとつ代表する ものを得ればよい • カテゴリ間では相関してない
記事リストの長さによる依存 • 記事リストの長さによって相関の度合いは変 わってくる
Metric trade-off
Predic'ng online from offline • Offline Accuracy – 推薦システムが存在しない状況で生成されたク リックログから予測されたクリック率 •
Online Accuracy – 推薦システムが稼働している状況でのクリック率
Feature Selec'on • Least Angle Regression • 各Featureが線形に作用してるという仮定 – L1正規化 •
これを用いて各Metricsがどの程度CTRに反映 させているかを測る y = T x + n X j=1 | xj |
Feature Selec'on
Regression model • MetricsからCTRを予測するモデルができた – 各Metrics間のTrade-offがわかる – Metricsがどのように寄与するかがわかる
Self adjust algorithm blend
Dataset[SwissInfo] • Swissinfo.ch – ニュースサイト • Offline data – 227k clicks, 28,525
stories, 118k users • Online data – 3つの推薦システムの動作時のログ • 直近200記事クリックを使って推薦 – 3週間 – 168k click
Dataset[Yahoo Front Page] • 15日間のYahooTopPageでのクリックデータ[Li +2011] • ページへの滞在が2値ベクトルとして記載, 20 アイテムが推薦されている
• 28M visit 653 items – 同じようなセッションを統合して5.7M click
Dataset[LePoint] • 3.5 days – 4.6M clicks and 3.3M users
Feature Selec'on
CTR Predic'on
Online Accuracy Predic'on
Algorithm Blending