[IR Reading 2022春論文紹介] Personalized Transfer of User Preferences for Cross-domain Recommendation (WSDM 2022) /IR-Reading-2022-spring

Slide 1

Slide 1 text

[論⽂紹介] Personalized Transfer of User Preferences for Cross-domain Recommendation Yongchun Zhu, Zhenwei Tang, Yudan Liu, Fuzhen Zhuang, Ruobing Xie, Xu Zhang, Leyu Lin, Qing He WSDM 2022 論⽂紹介する⼈筑波⼤学加藤研究室新⽥洸平 https://sites.google.com/view/kohei-shinden ※スライド中の図は論⽂より引⽤ 2022年5⽉21⽇ IR Reading 2022 春セッション 1 No.1

Slide 2

Slide 2 text

どんな論⽂？ 2 • コールドスタート問題に有効なクロスドメイン推薦⼿法においてユーザことにパーソナライズしたブリッジ関数を⽤いる⼿法を提案主な貢献 1. ユーザごとにパーソナライズしたブリッジ関数を学習する⼿法を提案 2. 推薦タスク指向の最適化を採⽤することでメタネットワーク学習を安定化 3. コールドスタートだけでなくウォームスタートにも有効であることを実証既存⼿法提案⼿法全てのユーザに共通のブリッジ関数ユーザごとにパーソナライズしたブリッジ関数

Slide 3

Slide 3 text

推薦システムで起こるコールドスタート問題 3 • 推薦システムにおいて新規のユーザやアイテムに対して正確な予測を⾏うことは困難→コールドスタート問題映画ドメインにおけるコンテンツベース推薦の例ウォームスタート推薦既存ユーザ閲覧履歴ユーザが興味を⽰したアイテムに似ているアイテムを推薦推薦コールドスタート推薦新規ユーザ閲覧履歴新規ユーザの興味はわからないため興味を⽰すアイテムの予測は困難使える情報がない？

Slide 4

Slide 4 text

• 推薦対象となるターゲットドメインに近いドメインの情報を利⽤することで学習性能の向上や効率の改善を⾏う⼿法コールドスタート問題に有効なクロスドメイン推薦 4 コールドスタート問題やデータスパース問題に対して有効な解決策新規ユーザ映画の閲覧履歴近いドメインの情報を利⽤することで補う本の購買履歴推薦本のドメインでは既存ユーザでありアイテムとのインタラクションがある

Slide 5

Slide 5 text

• ソースドメインからターゲットドメインへユーザの興味を伝達するために転移学習を⽤いたブリッジ関数を適⽤既存のクロスドメイン推薦における主な⼿法 5 ユーザA （本のドメインでは既存）ユーザA （映画のドメインでは新規）ソースドメインターゲットドメインユーザの興味を別ドメインへ転移する … … ソースドメインでのユーザ特徴ソースドメインの特徴を変換したターゲットドメインでのユーザ特徴特徴量空間へ埋め込むターゲットドメインでの特徴量の初期値として利⽤ブリッジ関数 𝒇(#) 同じユーザ

Slide 6

Slide 6 text

ソースドメインターゲットドメイン • ブリッジ関数が単⼀でありユーザごとに異なるソースドメインとターゲットドメイン間の複雑な興味の関係性を正確に捉えられない既存のクロスドメイン推薦における課題 6 ユーザA … ユーザAの特徴量ユーザB … ユーザBの特徴量ユーザC … ユーザCの特徴量 … ユーザA ユーザAの変換特徴量 … ユーザB ユーザBの変換特徴量 … ユーザC ユーザCの変換特徴量ブリッジ関数 𝒇(#) 全てのユーザは単⼀のブリッジ関数を利⽤ドメイン間の複雑な興味の関係を捉えられず性能低下につながる

Slide 7

Slide 7 text

• ドメイン間で異なるユーザごとの興味の関係性を捉えるためにユーザごとにパーソナライズしたブリッジ関数を実現⽬的と提案⼿法の概要 7 ソースドメインターゲットドメインユーザA … ユーザAの特徴量ユーザB … ユーザBの特徴量ユーザC … ユーザCの特徴量 … ユーザA ユーザAの変換特徴量 … ユーザB ユーザBの変換特徴量 … ユーザC ユーザCの変換特徴量ブリッジ関数 𝒇𝐀 (#) ブリッジ関数 𝒇𝐁 (#) ブリッジ関数 𝒇𝐂 (#)

Slide 8

Slide 8 text

• ブリッジ関数をユーザごとにパーソナライズするためにソースドメインからの特徴量エンコーダとメタ学習を採⽤提案⼿法の全体構成 8 ソースドメインターゲットドメインパーソナライズされたブリッジ関数ソースドメインのユーザ埋め込みソ " スドメインにおいてユ " ザが消費したアイテム特徴量ユーザごとの伝達特徴量 Attention ベースの特徴量エンコーダ変換したユーザ特徴量アイテム特徴量内積メタネットワーク

Slide 9

Slide 9 text

• ブリッジ関数をユーザごとにパーソナライズするためにソーズドメインからの特徴量エンコーダとメタ学習を採⽤提案⼿法の全体構成 9 提案⼿法のコア部分

Slide 10

Slide 10 text

• 推薦タスク指向のメタ学習によってドメイン間でユーザの興味を伝達するブリッジ関数をパーソナライズ推薦タスク指向のメタ学習 10 推薦タスク指向損失 min !,# 1 |ℛ$ % | ' &!"∈ℛ# $ (𝑟)* − 𝑓+! 𝑢) ,; 𝑤+! 𝑣* )- 誤差が最⼩化されるようにパラメータ 𝜽, 𝝓 を更新 • ℛ% & : ターゲット・ソースに共通するユーザのターゲットにおけるユーザ・アイテム評価値⾏列 • 𝑟'( : ユーザ・アイテム評価値 • 𝑢' ): ソースユーザ, 𝑣( : アイテム

Slide 11

Slide 11 text

• RQ1. コールドスタート設定でどの程度の性能を発揮するか？ →SOTA を⼤幅に上回りコールドスタート問題に有効 • RQ2. より実⽤的なシナリオでどのように機能するか？ →既存のモデルにも適⽤できてウォームスタートでも性能を発揮 • RQ3. なぜ提案⼿法は性能向上するのか？ →パーソナライズしたブリッジ関数や Attention ベースの特徴量エンコーダが⼤きく貢献していることが分析からわかったリサーチクエスチョン 11

Slide 12

Slide 12 text

• Amazon レビューデータセットを⽤いた推薦タスクによる評価実験実験設定 12 タスク１映画⾳楽タスク２本映画タスク３本⾳楽ソ " スタ " ゲ & ト • 0~5 のアイテムに対する評価値が含まれている • 評価指標は MAE, RMSE による予測誤差の⼤きさで評価→値が⼩さければより性能が良い Overlap はソース・ターゲットドメインに共通のユーザクロスドメイン推薦タスク

Slide 13

Slide 13 text

• 提案⼿法はクロスドメイン推薦における SOTA を⼤幅に上回りコールドスタート問題に有効であることがわかった実験結果: RQ1.コールドスタート設定でどの程度の性能を発揮するか？ 13 ターゲットドメインのみの⼿法は最も性能が悪いことがわかる提案⼿法は全ての既存クロスドメイン推薦より誤差が⼩さい βはテストユーザの割合

Slide 14

Slide 14 text

• 提案⼿法は⾏列因⼦分解やニューラルモデルなどに適⽤でき⼀般化しても⼗分な性能を発揮することがわかった実験結果: RQ2.より実⽤的なシナリオでどのように機能するか？ 1/2 14 緑⾊が提案⼿法であり全ての⼿法よりも予測誤差が⼩さいことがわかる • (Non-NN) MF Based: ⾏列因⼦分解への適応 • (NN) GMF Based:ブリッジ関数でユーザ埋め込みを直接変換 • (NN) YouTube DNN Based: Two tower model と呼ばれる⽅式 ※ NN = Neural Network

Slide 15

Slide 15 text

• ウォームスタートな状況でもより良い性能を⽰すことがわかった ‒ 既存⼿法は極端なコールドスタート設定下での実験結果のみ⽰していた実験結果: RQ2.より実⽤的なシナリオでどのように機能するか？ 2/2 15 薄い⾊がコールドスタート、濃い⾊がウォームスタート βはテストユーザの割合⾚⾊が提案⼿法であり全ての⼿法よりも予測誤差が⼩さいことがわかる

Slide 16

Slide 16 text

• ターゲットドメインに変換した埋め込みを可視化することで提案⼿法がより正解に近い表現を学習していることがわかった実験結果: RQ3.なぜ提案⼿法は性能向上するのか？ 16 Scikit-learn の t-SNE でタスク３における SOTA⼿法, 提案⼿法のターゲットドメインのユーザ埋め込みを β = 0.2 で可視化既存の SOTA 提案⼿法 • ⻘い点： Train, Test 両⽅のユーザを⽤いて学習したターゲットモデルから取り出した埋め込み（正解データ） • オレンジの点：変換後の埋め込み変換後の埋め込みが集中してしまっている変換後の埋め込みが正解によく適合

Slide 17

Slide 17 text

まとめ 17 • コールドスタート問題に有効なクロスドメイン推薦⼿法においてユーザことに異なるブリッジ関数を⼿法を提案既存⼿法提案⼿法全てのユーザに共通のブリッジ関数ユーザごとに異なるブリッジ関数 • RQ1. コールドスタート設定でどの程度の性能を発揮するか？ →SOTA を⼤幅に上回りコールドスタート問題に有効 • RQ2. より実⽤的なシナリオでどのように機能するか？ →既存のモデルにも適⽤できてウォームスタートでも性能を発揮 • RQ3. なぜ提案⼿法は性能向上するのか？ →パーソナライズしたブリッジ関数や Attention ベースの特徴量エンコーダが⼤きく貢献していることが分析からわかった

Slide 18

Slide 18 text

Appendix 18

Slide 19

Slide 19 text

• 𝜽 はソースドメインからユーザの興味を伝達特徴量として埋め込むための Attention ネットワークのパラメータ推薦タスク指向のメタ学習: θ 19 誤差が最⼩化されるようにパラメータ 𝜽, 𝝓 を更新伝達特徴量 𝒑*! = ) +" #∈-$! 𝑎( 𝑣( ) Attention スコア 𝑎( = exp(𝑎′( ) ∑ +% #∈-$! exp(𝑎′. ) 推薦タスク指向損失 min !,# 1 |ℛ$ % | ' &!"∈ℛ# $ (𝑟)* − 𝑓+! 𝑢) ,; 𝑤+! 𝑣* )- 伝達特徴量 Attention Network 𝑎′( = ℎ(𝑣( ; 𝜃) 𝒗 はアイテム特徴 𝑺 はソースドメイン

Slide 20

Slide 20 text

• 𝝓 はブリッジ関数をパーソナライズするためのパラメータ推薦タスク指向のメタ学習: φ 20 誤差が最⼩化されるようにパラメータ 𝜽, 𝝓 を更新推薦タスク指向損失 min !,# 1 |ℛ$ % | ' &!"∈ℛ# $ (𝑟)* − 𝑓+! 𝑢) ,; 𝑤+! 𝑣* )- 伝達特徴量ブリッジ関数のパラメータ 𝑤+! = 𝑔(𝑝+! ; 𝜙) 変換したユーザ特徴量 5 𝑢) % = 𝑓+! 𝑢) ,; 𝑤+! メタネットワークによるパラメータ⽣成パーソナライズされたブリッジ関数

Slide 21

Slide 21 text

• ケーススタディより Attention ベースの特徴量エンコーダはアイテムごとに異なる貢献度をよく捉えられている実験結果: RQ3.なぜ提案⼿法は性能向上するのか？ 21 左の例におけるクロスドメイン推薦の⽬標 CD を購⼊したことがないユーザに対してユーザの映画のインタラクションを使って CD を推薦⾊の濃さは Attentionにおける注⽬度の⾼さ • Attention によってソースドメインの異なるアイテムの重要度を適切にモデル化できていることが性能向上の要因と考えられる SF ドラマコメディハードロック