Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[論文紹介] Probabilistic Matrix Factorization
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ysekky
January 27, 2015
Research
0
660
[論文紹介] Probabilistic Matrix Factorization
Gunosy研究会 #82 2015/01/27
ysekky
January 27, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.3k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.8k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
810
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.2k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.4k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4k
Other Decks in Research
See All in Research
When Learned Data Structures Meet Computer Vision
matsui_528
1
2.9k
自動運転におけるデータ駆動型AIに対する安全性の考え方 / Safety Engineering for Data-Driven AI in Autonomous Driving Systems
ishikawafyu
0
130
Pythonでジオを使い倒そう! 〜それとFOSS4G Hiroshima 2026のご紹介を少し〜
wata909
0
1.3k
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
480
説明可能な機械学習と数理最適化
kelicht
2
940
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
550
Proposal of an Information Delivery Method for Electronic Paper Signage Using Human Mobility as the Communication Medium / ICCE-Asia 2025
yumulab
0
170
Thirty Years of Progress in Speech Synthesis: A Personal Perspective on the Past, Present, and Future
ktokuda
0
170
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
280
2026年1月の生成AI領域の重要リリース&トピック解説
kajikent
0
370
財務諸表監査のための逐次検定
masakat0
1
250
その推薦システムの評価指標、ユーザーの感覚とズレてるかも
kuri8ive
1
320
Featured
See All Featured
Facilitating Awesome Meetings
lara
57
6.8k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
120
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Balancing Empowerment & Direction
lara
5
890
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
740
For a Future-Friendly Web
brad_frost
182
10k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
67
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
150
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
50k
Transcript
[論文紹介] Probalis,c Matrix Factoriza,on Ruslan Salakhutdinov
and Andriy Mnih (University of Toronto) NIPS2008 Yoshifumi Seki (Gunosy Inc) 2015.01.27 @Gunosy研究会 #82
概要 • 協調フィルタリングのための次元削減手法の 提案 • NeQlix – 超大規模なデータ
• pLSAなどのギブスサンプリングでは遅いし正確性に欠 ける – バランスの悪いデータ(スパース, 偏り有り) • SVDなどでは評価値が少ないユーザの評価が平均的 なユーザに近づいてしまう
Probabilis,c Matrix Factoriza,on • MのアイテムとNのユー ザ • それぞれD次元の次元 を与えることを考える
• V, Uの各要素は平均0 のガウス分布を仮定
Probabilis,c Matrix Factoriza,on I : i, jに評価値があるときに1, それ以外は0 U, Vの対数事後分布を,
下記の条件の元で最大化する
Probabilis,c Matrix Factoriza,on • 値がすべて満たされている場合にはSVDの確率 モデルへの拡張とみなすことができる • ユーザとアイテムの内積をロジスティクス関数に 通す
• 評価値を0-‐1の範囲にMapする
Automa,c Complexity Control • 新しいデータにも適切に反映できるようにした い – 次元数を調整するのはアンバランスなデータの 場合は適切ではない
– これまでにないようなデータが入ってくる可能性 がある. • 分散のパラメータを調整することで対応させ る
Constrained PMF • PMFではデータが少な いユーザの情報が平均 に近づいてしまう • そのユーザが評価した アイテムの情報が評価
されやすいように制約 を与える
Constrained PMF ユーザのベクタは以下のようにして与えられる よって評価値は以下のようなモデルになる PMFと同様にパラメータ推定を行いモデルを生成する
Experimental Result • Dataset – a subset of NeQlix
• 50,000 users • 1,850 movies • 1,082,982 values – 半分以上は10個以下の評価しかない(sparse) • Parameter – Learning rate: 0.005 – Momentum: 0.9 – D: 30 – λ U, λV, λW, λY = 0.002
Experimental Result
None
None