Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[論文紹介] Probabilistic Matrix Factorization
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ysekky
January 27, 2015
Research
0
660
[論文紹介] Probabilistic Matrix Factorization
Gunosy研究会 #82 2015/01/27
ysekky
January 27, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.4k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.8k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
810
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.2k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.4k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4.1k
Other Decks in Research
See All in Research
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
210
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.5k
SREのためのテレメトリー技術の探究 / Telemetry for SRE
yuukit
13
3.4k
Off-Policy Evaluation and Learning for Matching Markets
yudai00
0
110
【NICOGRAPH2025】Photographic Conviviality: ボディペイント・ワークショップによる 同時的かつ共生的な写真体験
toremolo72
0
200
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
180
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
300
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp
1
520
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
6
4.1k
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
20
9.8k
AI Agentの精度改善に見るML開発との共通点 / commonalities in accuracy improvements in agentic era
shimacos
6
1.4k
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2k
Featured
See All Featured
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Reality Check: Gamification 10 Years Later
codingconduct
0
2.1k
How to build a perfect <img>
jonoalderson
1
5.3k
Odyssey Design
rkendrick25
PRO
2
550
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
310
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Why Our Code Smells
bkeepers
PRO
340
58k
sira's awesome portfolio website redesign presentation
elsirapls
0
200
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
76
Designing for Timeless Needs
cassininazir
0
170
Tell your own story through comics
letsgokoyo
1
870
Transcript
[論文紹介] Probalis,c Matrix Factoriza,on Ruslan Salakhutdinov
and Andriy Mnih (University of Toronto) NIPS2008 Yoshifumi Seki (Gunosy Inc) 2015.01.27 @Gunosy研究会 #82
概要 • 協調フィルタリングのための次元削減手法の 提案 • NeQlix – 超大規模なデータ
• pLSAなどのギブスサンプリングでは遅いし正確性に欠 ける – バランスの悪いデータ(スパース, 偏り有り) • SVDなどでは評価値が少ないユーザの評価が平均的 なユーザに近づいてしまう
Probabilis,c Matrix Factoriza,on • MのアイテムとNのユー ザ • それぞれD次元の次元 を与えることを考える
• V, Uの各要素は平均0 のガウス分布を仮定
Probabilis,c Matrix Factoriza,on I : i, jに評価値があるときに1, それ以外は0 U, Vの対数事後分布を,
下記の条件の元で最大化する
Probabilis,c Matrix Factoriza,on • 値がすべて満たされている場合にはSVDの確率 モデルへの拡張とみなすことができる • ユーザとアイテムの内積をロジスティクス関数に 通す
• 評価値を0-‐1の範囲にMapする
Automa,c Complexity Control • 新しいデータにも適切に反映できるようにした い – 次元数を調整するのはアンバランスなデータの 場合は適切ではない
– これまでにないようなデータが入ってくる可能性 がある. • 分散のパラメータを調整することで対応させ る
Constrained PMF • PMFではデータが少な いユーザの情報が平均 に近づいてしまう • そのユーザが評価した アイテムの情報が評価
されやすいように制約 を与える
Constrained PMF ユーザのベクタは以下のようにして与えられる よって評価値は以下のようなモデルになる PMFと同様にパラメータ推定を行いモデルを生成する
Experimental Result • Dataset – a subset of NeQlix
• 50,000 users • 1,850 movies • 1,082,982 values – 半分以上は10個以下の評価しかない(sparse) • Parameter – Learning rate: 0.005 – Momentum: 0.9 – D: 30 – λ U, λV, λW, λY = 0.002
Experimental Result
None
None