Slide 1

Slide 1 text

[論文紹介]     Probalis,c  Matrix  Factoriza,on     Ruslan  Salakhutdinov  and  Andriy  Mnih   (University  of  Toronto)   NIPS2008 Yoshifumi  Seki  (Gunosy  Inc)   2015.01.27  @Gunosy研究会  #82

Slide 2

Slide 2 text

概要 •  協調フィルタリングのための次元削減手法の 提案   •  NeQlix   – 超大規模なデータ   •  pLSAなどのギブスサンプリングでは遅いし正確性に欠 ける   – バランスの悪いデータ(スパース,  偏り有り)   •  SVDなどでは評価値が少ないユーザの評価が平均的 なユーザに近づいてしまう

Slide 3

Slide 3 text

Probabilis,c  Matrix  Factoriza,on •  MのアイテムとNのユー ザ   •  それぞれD次元の次元 を与えることを考える   •  V,  Uの各要素は平均0 のガウス分布を仮定  

Slide 4

Slide 4 text

Probabilis,c  Matrix  Factoriza,on I  :  i,  jに評価値があるときに1,  それ以外は0 U,  Vの対数事後分布を,  下記の条件の元で最大化する

Slide 5

Slide 5 text

Probabilis,c  Matrix  Factoriza,on •  値がすべて満たされている場合にはSVDの確率 モデルへの拡張とみなすことができる   •  ユーザとアイテムの内積をロジスティクス関数に 通す       •  評価値を0-­‐1の範囲にMapする                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            

Slide 6

Slide 6 text

Automa,c  Complexity  Control •  新しいデータにも適切に反映できるようにした い   – 次元数を調整するのはアンバランスなデータの 場合は適切ではない   – これまでにないようなデータが入ってくる可能性 がある.   •  分散のパラメータを調整することで対応させ る  

Slide 7

Slide 7 text

Constrained  PMF •  PMFではデータが少な いユーザの情報が平均 に近づいてしまう   •  そのユーザが評価した アイテムの情報が評価 されやすいように制約 を与える

Slide 8

Slide 8 text

Constrained  PMF ユーザのベクタは以下のようにして与えられる よって評価値は以下のようなモデルになる PMFと同様にパラメータ推定を行いモデルを生成する

Slide 9

Slide 9 text

Experimental  Result •  Dataset   –  a  subset  of  NeQlix     •  50,000  users   •  1,850  movies   •  1,082,982  values   –  半分以上は10個以下の評価しかない(sparse)   •  Parameter   –  Learning  rate:  0.005   –  Momentum:  0.9   –  D:  30   –  λ  U,  λV,  λW,  λY  =  0.002

Slide 10

Slide 10 text

Experimental  Result

Slide 11

Slide 11 text

No content

Slide 12

Slide 12 text

No content