Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介/Predicting Online Performance of News Reco...
Search
ysekky
December 22, 2015
Research
0
340
論文紹介/Predicting Online Performance of News Recommender Systems
ysekky
December 22, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.6k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
750
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.7k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.4k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.1k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.3k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.9k
Other Decks in Research
See All in Research
「熊本県内バス・電車無料デー」の振り返りとその後の展開@土木計画学SS:成功失敗事例に学ぶ公共交通運賃設定
trafficbrain
0
230
AIトップカンファレンスからみるData-Centric AIの研究動向 / Research Trends in Data-Centric AI: Insights from Top AI Conferences
tsurubee
3
1.8k
Neural Fieldの紹介
nnchiba
2
720
ダイナミックプライシング とその実例
skmr2348
3
610
Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping
satai
3
140
精度を無視しない推薦多様化の評価指標
kuri8ive
1
370
Leveraging LLMs for Unsupervised Dense Retriever Ranking (SIGIR 2024)
kampersanda
2
310
Batch Processing Algorithm for Elliptic Curve Operations and Its AVX-512 Implementation
herumi
0
120
PhD Defence: Considering Temporal and Contextual Information for Lexical Semantic Change Detection
a1da4
0
130
eAI (Engineerable AI) プロジェクトの全体像 / Overview of eAI Project
ishikawafyu
0
390
メールからの名刺情報抽出におけるLLM活用 / Use of LLM in extracting business card information from e-mails
sansan_randd
2
430
言語と数理の交差点:テキストの埋め込みと構造のモデル化 (IBIS 2024 チュートリアル)
yukiar
5
1.1k
Featured
See All Featured
Designing Experiences People Love
moore
140
23k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
The Cost Of JavaScript in 2023
addyosmani
47
7.4k
The Invisible Side of Design
smashingmag
299
50k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.5k
GraphQLとの向き合い方2022年版
quramy
44
14k
Code Review Best Practice
trishagee
67
18k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
40
2k
Building Applications with DynamoDB
mza
93
6.2k
Code Reviewing Like a Champion
maltzj
521
39k
Transcript
Predic'ng Online Performance of News Recommender Systems Through Richer Evelua'on
Metrics (Recsys 2015) Andrii Maksai, Florent Garcin, Boi Fal'ngs Ar'ficaial Intelligence Lab, Switzerland Yoshifumi Seki Gunosyデータマイニング研究会 2015.12.09
概要 • ニュース推薦の構築に関する論文 • 多くの推薦評価指標について – 各指標内、指標間の相関について – 指標が実際の成果(CTR)に与える影響について • アルゴリズムのチューニングについて •
オフラインのデータからオンラインの結果をど のように予測するか
様々な推薦システムの指標 • Accuracy – RMSEとか, MAEとか, F値とか • Diversity –
多様性 • Novelty – ユーザに取って新しいアイテムをどれだけ提示できるか • Coverage – 商品をどれだけカバーできるか • Serendipity – 意外性
評価指標の相関 • 各カテゴリ内のさまざまな指標は相関してい た – すべてを満足させる必要はなく,ひとつ代表する ものを得ればよい • カテゴリ間では相関してない
記事リストの長さによる依存 • 記事リストの長さによって相関の度合いは変 わってくる
Metric trade-off
Predic'ng online from offline • Offline Accuracy – 推薦システムが存在しない状況で生成されたク リックログから予測されたクリック率 •
Online Accuracy – 推薦システムが稼働している状況でのクリック率
Feature Selec'on • Least Angle Regression • 各Featureが線形に作用してるという仮定 – L1正規化 •
これを用いて各Metricsがどの程度CTRに反映 させているかを測る y = T x + n X j=1 | xj |
Feature Selec'on
Regression model • MetricsからCTRを予測するモデルができた – 各Metrics間のTrade-offがわかる – Metricsがどのように寄与するかがわかる
Self adjust algorithm blend
Dataset[SwissInfo] • Swissinfo.ch – ニュースサイト • Offline data – 227k clicks, 28,525
stories, 118k users • Online data – 3つの推薦システムの動作時のログ • 直近200記事クリックを使って推薦 – 3週間 – 168k click
Dataset[Yahoo Front Page] • 15日間のYahooTopPageでのクリックデータ[Li +2011] • ページへの滞在が2値ベクトルとして記載, 20 アイテムが推薦されている
• 28M visit 653 items – 同じようなセッションを統合して5.7M click
Dataset[LePoint] • 3.5 days – 4.6M clicks and 3.3M users
Feature Selec'on
CTR Predic'on
Online Accuracy Predic'on
Algorithm Blending