Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[論文紹介] Probabilistic Matrix Factorization

ysekky
January 27, 2015

[論文紹介] Probabilistic Matrix Factorization

Gunosy研究会 #82 2015/01/27

ysekky

January 27, 2015
Tweet

More Decks by ysekky

Other Decks in Research

Transcript

  1. [論文紹介]     Probalis,c  Matrix  Factoriza,on     Ruslan  Salakhutdinov

     and  Andriy  Mnih   (University  of  Toronto)   NIPS2008 Yoshifumi  Seki  (Gunosy  Inc)   2015.01.27  @Gunosy研究会  #82
  2. 概要 •  協調フィルタリングのための次元削減手法の 提案   •  NeQlix   – 超大規模なデータ  

    •  pLSAなどのギブスサンプリングでは遅いし正確性に欠 ける   – バランスの悪いデータ(スパース,  偏り有り)   •  SVDなどでは評価値が少ないユーザの評価が平均的 なユーザに近づいてしまう
  3. Probabilis,c  Matrix  Factoriza,on •  値がすべて満たされている場合にはSVDの確率 モデルへの拡張とみなすことができる   •  ユーザとアイテムの内積をロジスティクス関数に 通す

          •  評価値を0-­‐1の範囲にMapする                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            
  4. Automa,c  Complexity  Control •  新しいデータにも適切に反映できるようにした い   – 次元数を調整するのはアンバランスなデータの 場合は適切ではない  

    – これまでにないようなデータが入ってくる可能性 がある.   •  分散のパラメータを調整することで対応させ る  
  5. Experimental  Result •  Dataset   –  a  subset  of  NeQlix

        •  50,000  users   •  1,850  movies   •  1,082,982  values   –  半分以上は10個以下の評価しかない(sparse)   •  Parameter   –  Learning  rate:  0.005   –  Momentum:  0.9   –  D:  30   –  λ  U,  λV,  λW,  λY  =  0.002