Slide 1

Slide 1 text

© 2023 Wantedly, Inc. Augmented Negative Sampling for Collaborative Filtering RecSys2023 論文読み会 Y. Zhao, R. Chen, R. Lai, Q. Han, H. Song, and L. Chen Oct. 21 2023 - Presenter: Yudai Hayashi

Slide 2

Slide 2 text

© 2023 Wantedly, Inc. Self-introduction 林 悠大 ● 経歴: ○ 東京大学工学系研究科で博士号取得 ○ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社 ● Twitter(X): @python_walker ● 趣味: ○ 読書 ○ 音楽聴くこと ○ ウイスキー Twitter

Slide 3

Slide 3 text

© 2023 Wantedly, Inc. Short Summary ● 解決したかった課題: ○ Negative samplingするときに正例と近いサンプルを取ってこようと することが多いが、それ以外の負例にも学習に有用な情報はある はず ○ 負例の情報をもっと活用したい ● 手法: ○ 正例に近くない負例もaugmentationによって正例に近づけてやるこ とで学習効率を担保しつつ多くの情報を取り込む ● 結果: ○ CFモデルで性能の向上を実現

Slide 4

Slide 4 text

© 2023 Wantedly, Inc. Introduction:CFとnegative sampling = x #User #Item User Vector Item Vector 負例 行列分解(Matrix Factorization, MF)

Slide 5

Slide 5 text

© 2023 Wantedly, Inc. Introduction:CFとnegative sampling K. Mao et al., CIKM’21 CFの性能に対するnegative samplingの効果 CFにおいてnegative samplingが大きな効果を持つことはこれまでに知 られていた

Slide 6

Slide 6 text

© 2023 Wantedly, Inc. Introduction:negative samplingの手法 RNS DNS コスト 負例の品質 サンプリング戦 略 ランダム 高スコアの負例 を選択 低 高 低 高

Slide 7

Slide 7 text

© 2023 Wantedly, Inc. Introduction:negative samplingの手法 RNS DNS コスト 負例の品質 サンプリング戦 略 ランダム 高スコアの負例 を選択 低 高 低 高

Slide 8

Slide 8 text

© 2023 Wantedly, Inc. Introduction:negative samplingの手法 モデルの出力スコアが高い負例 = 良い負例というのは正しいのか? RNS DNS コスト 負例の品質 サンプリング戦 略 ランダム 高スコアの負例 を選択 低 高 低 高?

Slide 9

Slide 9 text

© 2023 Wantedly, Inc. Motivation:既存手法の問題点 ①Ambiguous trap 学習が進むにつれて 負例のスコア分布が 低い方に寄る スコアの高い負例をサンプリングしてくるのがどんどん難しくなっていく

Slide 10

Slide 10 text

© 2023 Wantedly, Inc. Motivation:既存手法の問題点 ②Information discrimination:スコアの低い負例には有用な情報は無い? Hx:モデルxで当てたイ ンタラクション数 x y PER(DNS, RNS)

Slide 11

Slide 11 text

© 2023 Wantedly, Inc. Motivation:既存手法の問題点 ②Information discrimination:スコアの低い負例には有用な情報は無い? スコアの低い負例を使わないと学習できない情報が多くある Hx:モデルxで当てたイ ンタラクション数 x y PER(RNS, DNS)!

Slide 12

Slide 12 text

© 2023 Wantedly, Inc. Method:ANS (Augmented Negative Sampling) :正例に近い成分

Slide 13

Slide 13 text

© 2023 Wantedly, Inc. Method:ANS (Augmented Negative Sampling) 負例の簡単な部分を 正例に寄せる

Slide 14

Slide 14 text

© 2023 Wantedly, Inc. Method:ANS (Augmented Negative Sampling) :正例に近い負例がほしい :もとはスコアが低かったサンプルの情報が ほ しい

Slide 15

Slide 15 text

© 2023 Wantedly, Inc. Method:ANS (Augmented Negative Sampling) BPR-loss ベクトルの分離に 関するロス

Slide 16

Slide 16 text

© 2023 Wantedly, Inc. Results Top-10指標で10 %を超える大きな性能向上

Slide 17

Slide 17 text

© 2023 Wantedly, Inc. Disentanglementの評価 t-SNE ● negative_hard(nh)と positive_hard(ph)が近い ● nhをランダムサンプリングして 学習させた結果HNSと同等の 性能 負例から正例に近い要素をうまく分離できている

Slide 18

Slide 18 text

© 2023 Wantedly, Inc. Discussions Amazon-Baby dataset ANSではRecallの上昇が大きい状 態を長く維持できている 良い負例を継続的に取ってこれてい る (Ambiguous trapの緩和) DNS vs ANS の負例の被り度合い モデルスコアの低い負例まで満遍なく 使えている(Information discriminationの緩和)

Slide 19

Slide 19 text

© 2023 Wantedly, Inc. Conclusion ● 負例の情報を包括的に学習に用いることができるnegative sampling手 法ANSを提案 ● 負例サンプルからより正例に近いデータを作り出して学習に利用 ● 既存のnegative sampling手法と比較してCFモデルの大幅な性能向上 を実現

Slide 20

Slide 20 text

© 2023 Wantedly, Inc. References ● Y. Zhao et al., Augmented Negative Sampling for Collaborative Filtering. 2023. In Seventeenth ACM Conference on Recommender Systems (RecSys ’23). ● K. Mao et al., SimpleX: A Simple and Strong Baseline for Collaborative Filtering. 2021. In Proceedings of the 30th ACM International Conference on Information and Knowledge Management (CIKM ’21)

Slide 21

Slide 21 text

© 2023 Wantedly, Inc.

Slide 22

Slide 22 text

© 2023 Wantedly, Inc. Appendix: ハイパーパラメータ依存性