Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bayesian Nonparametric Poisson Factrization for...
Search
ysekky
June 03, 2014
0
91
Bayesian Nonparametric Poisson Factrization for Recommendation Systems
ysekky
June 03, 2014
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.3k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.8k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
810
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.2k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.4k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4k
Featured
See All Featured
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
380
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
220
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
420
Balancing Empowerment & Direction
lara
5
890
Mind Mapping
helmedeiros
PRO
0
89
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
140
Optimizing for Happiness
mojombo
379
71k
Transcript
論文紹介 Bayesian Nonparametric Poisson Factoriza3on for Recommenda3on
Systems Yoshifumi Seki Gunosy Inc. Gunosy研究会 6.3
概要 • 著者 – Prem Gopalan – Farancisco J. R.
Ruiz – Rajesh Ranganath – David M. Blei • LDAの神様 • 学会 – AISTATS 2014
やっていること • 因子分解 – Matrix Factoriza3onみたいなやつ • 参考:
hQp://qiita.com/ysks3n/items/c81ff24da0390a74fc6c – 各アイテム・ユーザの属性ベクトルを推定する • 非ゼロ要素について最適化し,その他の要素 の値を予測する
Poisson Factoriza3on • Scalable Recommenda3on with Poisson Factoriza3on
– airXiv:1311.1704v3 – 同じ著者の1年前の論文 – MFなどより精度が高くなっている • GaP: A Factor Model for Discrete Data – Canny ,SIGIR(2004) – トピックモデル系 – 性能もいいとのこと • hQp://heartruptcy.blog.fc2.com/blog-‐entry-‐131.html
Poisson Factoriza3on • いいところ – ガウス分布を仮定している多くのモデルと違って重みの正規化(総和で1にな るように)しなくてよい –
発生しなかった事象のみを処理することに向いている Gopalan(2013)より.HPFが本論文の提案手法のもとになった手法
本論文の目的 • 潜在空間モデルは事前に次元数を決定する 必要がある. – 次元数によってかなり精度かわる.これはイケて ない – だから次元数を指定しないでノンパラメトリックに 決める方法を提案する
• 変数推定もそんなに複雑じゃないから以前の ものと同じぐらいで計算できる – ここは正直よくわかってない><
Contribu3on • A New Baysian nonparametric model for Poisson
Factoriza3on • Scalable Varia3onal inference algorith with nasted varia3onal families – これまでのBaysian nonparametrix factor modelは スケーラブルでなかった • Neblixのデータを用いて実験を行った結果高 い精度を得ることができた – 前述したPoisson Factoriza3onと比較
Method
Method • Gopalan et al(2013)において次元数のKを変化さ せて最適な次元数を探した • 本論文では次元数を無限にあるものと設定して ユーザ・アイテムベクトルの内積を予測する
• そのために以下の仮定をおく – ユーザ,アイテムそれぞれのベクトルは非負の値を 持つ無限次元で表される – ユーザ・アイテムの内積は有限値である – アイテムのベクトル値はすべてのユーザに共通にな る
Method Gamma Processにより下記のようにして最適化できる(らしい) ガウス分布を使ったものと違い 0に対しても確率値を与えることができる (らしい)
Inference 評価値を表す潜在要素を定義 変数の同時分布は以下のように定義される 変数分布を以下のようにあらわす
Inference
Result(Log likelihood)
Result(Precision-‐Rank) • データセットが増えるほど制度の差は大きくなる • 次元の値によって制度には差があり,次元を決めなくてもよ い提案手法には優位性がある
収束時間 収束がひじょうに早い
まとめ・感想 • 潜在空間における課題である次元数を与え ることなく最適化できる – 本当に?Tを変えたら精度変わらない補償がどこ にあるの? • 大規模なデータで既存手法よりも確実に高い
ので,データのスパース性につよいのは本当 ぽい • 変数推定のやりかたがわからなさすぎて辛い ので次回の発表はこの関連論文を読みます