[NeurIPS2023論文読み会] Generate What You Prefer: Reshaping Sequential Recommendation via Guided Diffusion

(FOFSBUF8IBU:PV1SFGFS 3FTIBQJOH4FRVFOUJBM3FDPNNFOEBUJPO WJB(VJEFE%JGGVTJPO 4IVTVLF 5BLBIBNB -:$PSQ /FVS*14 ࿦จಡΈձ

⾃⼰紹介⾼濱修輔 ML engineer at LY Corp. • 新卒3年⽬
• LINE公式アカウントやLINE NEWSの記事の推薦などをやってます • 推薦多様性にも興味あります DPP (Determinantal Point Process, ⾏列式点過程) の理論と、推薦システムの多様性向上への挑戦 ‒ Qiita ⼤学では医療画像解析を研究していました • Multi-Stage Pathological Image Classification Using Semantic Segmentation (ICCV 2019 accepted) • Domain Adaptive Multiple Instance Learning for Instance-level Prediction of Pathological Images (ISBI 2023 accepted) • 修論が国際学会ISBI2023に採択されたのでコロンビアのカルタヘナに⾏ってきた【1泊6⽇】- note (Shusuke Takahama) @grouse324st 1

論⽂紹介 NeurIPS論⽂読み会で発表予定だけど、どの論⽂にしようかな？ → Oral論⽂ (77件) の中にたくさんLLM系論⽂があるのを発⾒！ https://neurips.cc/virtual/2023/events/oral より 2

論⽂紹介この論⽂良さそう！ https://arxiv.org/abs/2305.10601 より昨年6⽉の時点で発表され話題に！既に300件以上引⽤！検索すればいくらでも記事が出てくる！ LLM怖い！展開早過ぎ！発表やめとこ... 3

論⽂紹介この論⽂良さそう！ https://arxiv.org/abs/2305.10601 より昨年6⽉の時点で発表され話題に！既に300件以上引⽤！検索すればいくらでも記事が出てくる！発表枠が7分しかないのでこんな話をしている場合ではない
LLM怖い！展開早過ぎ！発表やめとこ... 4

論⽂紹介 Generate What You Prefer: Reshaping Sequential Recommendation via Guided
Diffusion (Z. Yang et al, 2023) https://arxiv.org/pdf/2305.10601.pdf ⼀⾔で⾔うと... 推薦システムに拡散モデルを適⽤してみた（しかも効率的に） Negative/Positiveサンプルのペアからユーザーの嗜好を推定するのではなく、拡散モデルで直接埋め込みを⽣成してやろうという試み 5

推薦システム多くのコンテンツの中から、ユーザーが興味あるであろうものを優先的に提⽰して意思決定を⽀援する推薦ロジックの例 • 協調フィルタリング • Factorization Machine •
Two-tower Model • ⽣成モデルベースの推薦⼿法 • VAE系: CDAE [Wu+, 2016], Mult-VAE [Liang+, 2018] • GAN系: VAEGAN [Yu+, 2019] , SD-GAR [Jin+, 2020] • 過去にユーザーがインタラクション（購⼊・クリック等）したアイテムの履歴を使って学習するのが基本 • アイテム情報（テキスト・画像など）やユーザー情報（デモグラ情報など）を使うものもある 6 某ECサイトにおけるおすすめの例

拡散モデル • 画像⽣成等の分野で爆発的に流⾏った⼿法（DALL-E, Imagenなど） • 時間が経つにつれ⼤きくなるノイズを予測するモデルを学習することで、最終的にノイズから画像を⽣成できるようになる • （⼀般的には）VAEやGANよりも質の⾼い出⼒を安定的に⽣成できるのが強み何かしらのモデル
元のデータ予測されたノイズ学習 (Forward) ノイズ付与されたデータ（最初はガウシアンノイズ）⽣成 (Reverse) 時間 t (0 ≤ 𝑡 ≤ 𝑇)で増えるノイズを追加し、モデルでノイズを推定時間 𝑇 の分だけノイズ除去を繰り返すノイズ ⊕ 予測されたノイズ時刻情報時刻情報 7

提案⼿法拡散モデルを使って、推薦したいアイテムのEmbeddingを直接⽣成する Negative Item（インタラクションしてないアイテム情報）を必要としないのが強み学習 • 逐次推薦において、最後（ 𝑛 個⽬）にユーザーがインタラクションしたアイテムを⽣成する
• アイテムのEmbeddingに、時刻 t でのノイズを付与し、デノイズされたデータを出⼒ • 元データと出⼒データの差分を損失とする予測 • ガウシアンノイズからスタートして、デノイズを 𝑇 回繰り返す • 最終的に⽣成されたEmbeddingに近いアイテムを近傍探索によって推薦する MLPモデル元データ予測されたでのノイズ ⊕ MLPモデルノイズ付与されたデータ予測された⽣成 (Reverse) 学習 (Forward) 8

提案⼿法このままだとユーザーの好みによらず適当なアイテムが⽣成されてしまう →コンディションを追加する MLPモデル元データ予測された⽣成 (Reverse) でのノイズ ⊕
MLPモデルノイズ付与されたデータ予測された学習 (Forward) エンコーダー … エンコーダー … • 直近の過去 𝑛 − 1 回でユーザーがインタラクションしたアイテム情報を使う • エンコーダーでユーザー履歴の Embedding 𝑐!"# を⽣成し、 MLPモデルに⼊れる • 𝑐!"# を⼊れる/⼊れない場合のバランス（個⼈最適化の度合）を 𝑤 で制御する 9

提案⼿法学習 • 逐次推薦において、最後（ 𝑛 個⽬）にユーザーがインタラクションしたアイテムを⽣成する • アイテムのEmbeddingに、時刻 t
でのノイズを付与し、デノイズされたデータを出⼒ • 元データと出⼒データの差分を損失とする予測 • ガウシアンノイズからスタートして、デノイズを 𝑇 回繰り返す • 最終的に⽣成されたEmbeddingに近いアイテムを近傍探索によって推薦する MLPモデル元データ予測されたでのノイズ ⊕ MLPモデルノイズ付与されたデータ予測された⽣成 (Reverse) 学習 (Forward) 10 拡散モデルを使って、推薦したいアイテムのEmbeddingを直接⽣成する Negative Item（インタラクションしてないアイテム情報）を必要としないのが強み

拡散モデルを使って、推薦したいアイテムのEmbeddingを直接⽣成する Negative Item（インタラクションしてないアイテム情報）を必要としないのが強み提案⼿法学習 • 逐次推薦において、最後（ 𝑛 個⽬）にユーザーがインタラクションしたアイテムを⽣成する
• アイテムのembeddingに、時刻 t でのノイズを付与し、デノイズされたデータを出⼒ • 元データと出⼒データの差分を損失とする予測 • ガウシアンノイズからスタートして、デノイズを 𝑇 回繰り返す • 最終的に⽣成されたEmbeddingに近いアイテムを近傍探索によって推薦する MLPモデル元データ予測されたでのノイズ ⊕ MLPモデルノイズ付与されたデータ予測された⽣成 (Reverse) 学習 (Forward) Negative Itemを使わないのが推しポイントらしいけど、そんなに嬉しいの？ 11

提案⼿法 Negative Itemの情報を使わず直接Item Embeddingを⽣成することで • ベクトルサイズが⼤きくなり過ぎたり、モデルが複雑になったりすることを防げる • ノイジーなNegative Itemを使わなくて済み、精度が改善する Negative
Itemの話は、拡散モデル+推薦の既存研究を意識していそう。例えば、 DiffRec [Wang+, SIGIR 2023] ノイズ ⊕ 0 1 0 … 1 モデル 0.1 0.8 0.6 … 0.8 Item 1 Item 2 Item 3 … Item n 全アイテムについてインタラクションの有無の0/1ベクトル再構成されたベクトル • 全アイテム数の次元を持ったユーザ履歴情報のベクトルを再構成する • アイテム数が多い場合は、ユーザーベクトルを VAE等で圧縮する 12

実験データセット逐次推薦の分野で使われる3つ: YooChoose, KuaiRec, Zhihu ⽐較⼿法 • GRU3Rec, Caser,
SASRec：深層モデルでembedding推定する系 • S-IPS, AdaRanker：因果推論などを使ってbias除去に注⼒ • CL4SRec：⾃⼰教師あり学習を利⽤ • DiffRec：拡散モデル＋推薦の先⾏研究定量評価 13

実験 Item Embeddingの可視化 • 提案⼿法が最も⼀様に分布しており、埋め込み空間を効果的に使えている • Negative Itemを使わないことで、 Embeddingの過度な集中を防げる（らしい）
個⼈最適化パラメータ𝑤の制御 • パラメータ𝑤で、ユーザーごとに過去の履歴をどれだけ重視するか制御できる • タスクごとに最適な𝑤が存在する 14

感想 • 拡散モデルを推薦システムに適⽤し、逐次推薦の次にインタラクションするアイテムのEmbeddingを直接⽣成しようとする研究 • ⼿法⾃体はシンプルなので、過去の⽣成モデル系（VAE, GANなど）の論⽂に似たようなものがあるのではと思っている（調べきれてない） • ⽣成モデルベースの推薦⼿法が活⽤されている例をあまり知らないので、
実⽤的な意味で競争⼒があるのかは深掘りしてみたい • Negative Itemを使わないとベクトルサイズが爆発しなくて済む、という利点は理解できたが、それ以外のメリットはそこまでわからなかった。効率よくNegative Itemの情報を⼊れられれば性能は良くなるのでは？ 15

[NeurIPS2023論文読み会] Generate What You Prefer: Re...

[NeurIPS2023論文読み会] Generate What You Prefer: Reshaping Sequential Recommendation via Guided Diffusion

Shusuke Takahama

More Decks by Shusuke Takahama

Featured

Transcript

(FOFSBUF8IBU:PV1SFGFS 3FTIBQJOH4FRVFOUJBM3FDPNNFOEBUJPO WJB(VJEFE%JGGVTJPO 4IVTVLF 5BLBIBNB -:$PSQ /FVS*14 ࿦จಡΈձ

⾃⼰紹介⾼濱修輔 ML engineer at LY Corp. • 新卒3年⽬

論⽂紹介 NeurIPS論⽂読み会で発表予定だけど、どの論⽂にしようかな？ → Oral論⽂ (77件) の中にたくさんLLM系論⽂があるのを発⾒！ https://neurips.cc/virtual/2023/events/oral より 2

論⽂紹介この論⽂良さそう！ https://arxiv.org/abs/2305.10601 より昨年6⽉の時点で発表され話題に！既に300件以上引⽤！検索すればいくらでも記事が出てくる！ LLM怖い！展開早過ぎ！発表やめとこ... 3

論⽂紹介この論⽂良さそう！ https://arxiv.org/abs/2305.10601 より昨年6⽉の時点で発表され話題に！既に300件以上引⽤！検索すればいくらでも記事が出てくる！発表枠が7分しかないのでこんな話をしている場合ではない

論⽂紹介 Generate What You Prefer: Reshaping Sequential Recommendation via Guided

推薦システム多くのコンテンツの中から、ユーザーが興味あるであろうものを優先的に提⽰して意思決定を⽀援する推薦ロジックの例 • 協調フィルタリング • Factorization Machine •

提案⼿法このままだとユーザーの好みによらず適当なアイテムが⽣成されてしまう →コンディションを追加する MLPモデル元データ予測された⽣成 (Reverse) でのノイズ ⊕

提案⼿法学習 • 逐次推薦において、最後（ 𝑛 個⽬）にユーザーがインタラクションしたアイテムを⽣成する • アイテムのEmbeddingに、時刻 t

提案⼿法 Negative Itemの情報を使わず直接Item Embeddingを⽣成することで • ベクトルサイズが⼤きくなり過ぎたり、モデルが複雑になったりすることを防げる • ノイジーなNegative Itemを使わなくて済み、精度が改善する Negative

実験データセット逐次推薦の分野で使われる3つ: YooChoose, KuaiRec, Zhihu ⽐較⼿法 • GRU3Rec, Caser,

実験 Item Embeddingの可視化 • 提案⼿法が最も⼀様に分布しており、埋め込み空間を効果的に使えている • Negative Itemを使わないことで、 Embeddingの過度な集中を防げる（らしい）