Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
[論文紹介] Probalis,c Matrix Factoriza,on Ruslan Salakhutdinov and Andriy Mnih (University of Toronto) NIPS2008 Yoshifumi Seki (Gunosy Inc) 2015.01.27 @Gunosy研究会 #82
Slide 2
Slide 2 text
概要 • 協調フィルタリングのための次元削減手法の 提案 • NeQlix – 超大規模なデータ • pLSAなどのギブスサンプリングでは遅いし正確性に欠 ける – バランスの悪いデータ(スパース, 偏り有り) • SVDなどでは評価値が少ないユーザの評価が平均的 なユーザに近づいてしまう
Slide 3
Slide 3 text
Probabilis,c Matrix Factoriza,on • MのアイテムとNのユー ザ • それぞれD次元の次元 を与えることを考える • V, Uの各要素は平均0 のガウス分布を仮定
Slide 4
Slide 4 text
Probabilis,c Matrix Factoriza,on I : i, jに評価値があるときに1, それ以外は0 U, Vの対数事後分布を, 下記の条件の元で最大化する
Slide 5
Slide 5 text
Probabilis,c Matrix Factoriza,on • 値がすべて満たされている場合にはSVDの確率 モデルへの拡張とみなすことができる • ユーザとアイテムの内積をロジスティクス関数に 通す • 評価値を0-‐1の範囲にMapする
Slide 6
Slide 6 text
Automa,c Complexity Control • 新しいデータにも適切に反映できるようにした い – 次元数を調整するのはアンバランスなデータの 場合は適切ではない – これまでにないようなデータが入ってくる可能性 がある. • 分散のパラメータを調整することで対応させ る
Slide 7
Slide 7 text
Constrained PMF • PMFではデータが少な いユーザの情報が平均 に近づいてしまう • そのユーザが評価した アイテムの情報が評価 されやすいように制約 を与える
Slide 8
Slide 8 text
Constrained PMF ユーザのベクタは以下のようにして与えられる よって評価値は以下のようなモデルになる PMFと同様にパラメータ推定を行いモデルを生成する
Slide 9
Slide 9 text
Experimental Result • Dataset – a subset of NeQlix • 50,000 users • 1,850 movies • 1,082,982 values – 半分以上は10個以下の評価しかない(sparse) • Parameter – Learning rate: 0.005 – Momentum: 0.9 – D: 30 – λ U, λV, λW, λY = 0.002
Slide 10
Slide 10 text
Experimental Result
Slide 11
Slide 11 text
No content
Slide 12
Slide 12 text
No content