IRReading2020Fall-yanagida

Slide 1

Slide 1 text

筑波大学加藤研究室 B4 柳田雄輝 https://ynagi2.github.io/ Interactive Recommender System via Knowledge Graph- enhanced Reinforcement Learning(SIGIR 2020) Attentional Graph Convolutional Networks for Knowledge Concept Recommendation in MOOCs in a Heterogeneous View(SIGIR 2020) の紹介 2020-10-31 IR Reading 2020秋（オンライン）

Slide 2

Slide 2 text

Interactive Recommender System via Knowledge Graph-enhanced Reinforcement Learning(SIGIR 2020) 2 Authors: Sijin Zhou, Xinyi Dai, Haokun Chen, Weinan Zhang, Kan Ren, Ruiming Tang, Xiuqiang He, Yong Yu

Slide 3

Slide 3 text

• グラフに強化学習を用いた推薦手法が提案されている ○ 強化学習のエージェントがグラフ上を探索 ○ エージェントが辿ったパスから多様なアイテムを推薦可能背景 3 NES CAFE うまい棒 pocky KitKat 共に買われたアイテムのネットワークエージェント NES CAFE pocky KitKat pockyを買った人に NESCAFEを推薦エージェントが辿ったパス例

Slide 4

Slide 4 text

• 強化学習では多くのサンプリングとデータが必要 ○ エージェントの試行回数がかなり必要 • 効率的に学習したい • エージェントに知識グラフを探索させ効率的に学習 ○ e.g. うまい棒を見たユーザに対してはお菓子を中心に探索本研究のアイデア 4 NES CAFE pocky KitKat Nestle お菓子うまい棒知識グラフお菓子以外は探索されない 2-hopまで辿るとすると，任意のお菓子を辿れる produced by belongs to

Slide 5

Slide 5 text

手法の全体像 5 Q学習に基づきエージェントの行動(推薦するアイテム)を決定クリックしてきたアイテムの埋め込みから状態(ユーザの選好)を得る推薦候補となるアイテムを知識グラフから得る Q学習: 行動価値関数に基づくアルゴリズム

Slide 6

Slide 6 text

グラフ構造を加味した埋め込みをクリックしたアイテム順に RNNへ入力，状態(ユーザの選好)を得る手法 1/2 (状態の表現) 6 Graph Convolutional Network(GCN)でグラフ構造を加味アイテムの埋め込みグラフ構造を加味した埋め込みに変換例 A B C 特徴量を持ったノード GCN A B C グラフ構造を加味した特徴量を持ったノード

Slide 7

Slide 7 text

クリックしたノードからk-hop以内のアイテムを推薦候補とし，その中から行動(推薦するアイテム)を決定手法 2/2 (行動の決定) 7 得た候補もGCNにかける • 得た状態と行動から最も価値が高くなるアイテムを推薦 ○ Dueling Q-Networkによって行動を決定 • Q関数を状態で決まる部分と行動で決まる部分に分けて求める

Slide 8

Slide 8 text

アイテムが32回クリックされるまでの平均報酬，平均累積適合率，平均累積再現率で評価評価 8 • データセットはBook-Crossing, MovieLens ○ シミュレーションにより実験 ○ 報酬(エージェントの評価)はシミュレーションで期待されるレーティング値と推薦の成功回数を用いて決定 • ベースラインはGreedySVDやDDPG[1]など ○ DDPG: 連続値空間でKNN+Q学習を用いて推薦を行う手法 [1] Dulac-Arnold et al. Deep reinforcement learning in large discrete action spaces. arXiv preprint arXiv:1512.07679 (2015)

Slide 9

Slide 9 text

9 • ベースラインよりも良いパフォーマンスを記録 • 結果はAppendixに掲載 • より長い期間で実験した結果，他の手法と比べて少ない試行数で高い報酬が得られることを確認 • 提案手法により効率的な学習が実現できているといえる実験提案手法

Slide 10

Slide 10 text

• 提案手法の各構成要素を除いてみて実験 ○ グラフとして扱わない，GCNを用いないなど • 知識グラフを除いた場合と過去のデータを用いて学習した場合で結果にほぼ差がないとしている ○ 知識グラフは過去のデータの代替手段となり得る • 知識グラフはコールドスタート問題にも有効といえる提案手法の分析 10

Slide 11

Slide 11 text

アイデア: エージェントに知識グラフを探索させ効率的に学習まとめ 11 Q学習: 行動価値関数に基づくアルゴリズム推薦候補となるアイテムを知識グラフから得るクリックしてきたアイテムの埋め込みから状態(ユーザの選好)を得る Q学習に基づきエージェントの行動(推薦するアイテム)を決定

Slide 12

Slide 12 text

Attentional Graph Convolutional Networks for Knowledge Concept Recommendation in MOOCs in a Heterogeneous View(SIGIR 2020) 12 Authors: Jibing Gong, Shen Wang, Jinlong Wang, Wenzheng Feng, Hao Peng, Jie Tang, Philip S. Yu

Slide 13

Slide 13 text

MOOCsで講義コースではなくknowledge conceptを推薦 ○ knowledge concept(KC): depth-first search, binary tree など • 各講義動画のタグのような役割を果たす ○ 目的: よりミクロな興味を考慮した推薦を可能にする研究目的 13 MOOCsでのデータ例ユーザのたどったKC

Slide 14

Slide 14 text

手法の流れ 14 word2vecで KCを埋め込む Matrix Factorizationでユーザの KCへの興味を予測クリック情報などからメタパスを表す行列を生成 • メタパス: ノードを抽象化したパス ○ ノード間の関係性を表現できる ○ e.g. user-course-userは同じコースを受講する人の関係生成した行列を考慮した埋め込みを得る Attentionで重み付け

Slide 15

Slide 15 text

• 緑: ユーザの興味に関係するKC ○ より多く興味のあるKCを推薦できている • 水色: ユーザが実際にクリックしたKC ケーススタディ 15 コースのみを考慮した場合 KCを考慮した場合

Slide 16

Slide 16 text

• knowledge conceptを考慮することで，よりミクロな興味を考慮した推薦を可能にした ○ よりユーザの要求に即した推薦を行っている ○ knowledge concept(KC): depth-first search, binary tree など • メタパスとAttentionを用いてKCへの興味を予測 ○ ノード間の関係性をメタパスで表し従来のコース推薦手法と比較まとめ 16