Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bayesian Nonparametric Poisson Factrization for...
Search
ysekky
June 03, 2014
0
85
Bayesian Nonparametric Poisson Factrization for Recommendation Systems
ysekky
June 03, 2014
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
1.9k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.5k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
1.9k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
730
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.6k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.4k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
980
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.2k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.8k
Featured
See All Featured
Designing the Hi-DPI Web
ddemaree
280
34k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
880
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
How GitHub (no longer) Works
holman
310
140k
5 minutes of I Can Smell Your CMS
philhawksworth
202
19k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.1k
VelocityConf: Rendering Performance Case Studies
addyosmani
325
24k
How To Stay Up To Date on Web Technology
chriscoyier
788
250k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Happy Clients
brianwarren
98
6.7k
Bash Introduction
62gerente
608
210k
Transcript
論文紹介 Bayesian Nonparametric Poisson Factoriza3on for Recommenda3on
Systems Yoshifumi Seki Gunosy Inc. Gunosy研究会 6.3
概要 • 著者 – Prem Gopalan – Farancisco J. R.
Ruiz – Rajesh Ranganath – David M. Blei • LDAの神様 • 学会 – AISTATS 2014
やっていること • 因子分解 – Matrix Factoriza3onみたいなやつ • 参考:
hQp://qiita.com/ysks3n/items/c81ff24da0390a74fc6c – 各アイテム・ユーザの属性ベクトルを推定する • 非ゼロ要素について最適化し,その他の要素 の値を予測する
Poisson Factoriza3on • Scalable Recommenda3on with Poisson Factoriza3on
– airXiv:1311.1704v3 – 同じ著者の1年前の論文 – MFなどより精度が高くなっている • GaP: A Factor Model for Discrete Data – Canny ,SIGIR(2004) – トピックモデル系 – 性能もいいとのこと • hQp://heartruptcy.blog.fc2.com/blog-‐entry-‐131.html
Poisson Factoriza3on • いいところ – ガウス分布を仮定している多くのモデルと違って重みの正規化(総和で1にな るように)しなくてよい –
発生しなかった事象のみを処理することに向いている Gopalan(2013)より.HPFが本論文の提案手法のもとになった手法
本論文の目的 • 潜在空間モデルは事前に次元数を決定する 必要がある. – 次元数によってかなり精度かわる.これはイケて ない – だから次元数を指定しないでノンパラメトリックに 決める方法を提案する
• 変数推定もそんなに複雑じゃないから以前の ものと同じぐらいで計算できる – ここは正直よくわかってない><
Contribu3on • A New Baysian nonparametric model for Poisson
Factoriza3on • Scalable Varia3onal inference algorith with nasted varia3onal families – これまでのBaysian nonparametrix factor modelは スケーラブルでなかった • Neblixのデータを用いて実験を行った結果高 い精度を得ることができた – 前述したPoisson Factoriza3onと比較
Method
Method • Gopalan et al(2013)において次元数のKを変化さ せて最適な次元数を探した • 本論文では次元数を無限にあるものと設定して ユーザ・アイテムベクトルの内積を予測する
• そのために以下の仮定をおく – ユーザ,アイテムそれぞれのベクトルは非負の値を 持つ無限次元で表される – ユーザ・アイテムの内積は有限値である – アイテムのベクトル値はすべてのユーザに共通にな る
Method Gamma Processにより下記のようにして最適化できる(らしい) ガウス分布を使ったものと違い 0に対しても確率値を与えることができる (らしい)
Inference 評価値を表す潜在要素を定義 変数の同時分布は以下のように定義される 変数分布を以下のようにあらわす
Inference
Result(Log likelihood)
Result(Precision-‐Rank) • データセットが増えるほど制度の差は大きくなる • 次元の値によって制度には差があり,次元を決めなくてもよ い提案手法には優位性がある
収束時間 収束がひじょうに早い
まとめ・感想 • 潜在空間における課題である次元数を与え ることなく最適化できる – 本当に?Tを変えたら精度変わらない補償がどこ にあるの? • 大規模なデータで既存手法よりも確実に高い
ので,データのスパース性につよいのは本当 ぽい • 変数推定のやりかたがわからなさすぎて辛い ので次回の発表はこの関連論文を読みます