論文読み会 AAAI2021 | Knowledge-Enhanced Top-K Recommendation in Poincaré Ball

Slide 1

Slide 1 text

Knowledge-Enhanced Top-K Recommendation in Poincaré Ball 著者: Chen Ma, Liheng Ma, Yingxue Zhang, Haolun Wu, Xue Liu, Mark Coates (McGill Univ. & Huawei Noah's Ark Lab Montreal) 学会: AAAI2021 2023-7-4 @cocomoff 1/17

Slide 2

Slide 2 text

発表の内容推薦モデル + 知識グラフ推薦モデル: 過去のログから (未知) アイテムの評価値を推定する知識グラフ: 外部知識を表現する (e.g., 同じ監督の作品; directed_by) 著者らの4つの貢献 (3つの技術的な貢献+実験) (1) 双極空間を活用した推薦(RS)+知識グラフ(KG)を提案した (2) KGの情報を活用するためにアテンションのような構造を導入した (3) ハイパーパラメータに対処するためにバイレベル最適化を導入した (4) 実験で性能を確認した 2/17

Slide 3

Slide 3 text

概要 (イントロ) 推薦モデル (例: アイテムの評価値を計算する) + 知識グラフ (例: 同じ監督) KG活用のこれまでのアプローチと課題 [アプローチ] Path-based: KG上の経路を使って高次の情報を活用する [アプローチ] Regularization-based: KG由来のロスを追加する [課題] KG埋め込みがユークリッド空間 [課題] KG上で隣接するentityの扱いが効率的ではなかった [課題] KG由来のロスを制御するハイパーパラメータの調整が難しかった提案手法 (後述) は前ページの3つの技術的な貢献によって良い性能を出した 3/17

Slide 4

Slide 4 text

(1) 双極空間を活用した推薦(RS)+知識グラフ(KG)を提案した (2) KGの情報を活用するためにアテンションのような構造を導入した 4/17

Slide 5

Slide 5 text

ポアンカレ埋め込みの復習非ユークリッド空間の1つである、双極空間に埋め込む手法の代表例 (NeurIPS2017) 次元、半径の空間 ; . 局所的な測り方ユークリッド空間: ; 円周に近づくと無限距離 (歪んでるので測地線を使う) として : メビウス和 (右) 歴史的には他にもあった勾配法は少し改造 (Riemannian SGD) 勾配を求めて、軽量を直して (歪み補正)、更新して、歪んだ空間に戻す 5/17

Slide 6

Slide 6 text

埋め込みベクトルとランキングロス・知識グラフランキングロス [前ページ] ベクトルの間の距離が得られたユーザとアイテムの距離を用いてランキングロスを考えるユーザ、正例、負例について: KG 知識グラフあるアイテムのKG情報 TransE-styleの埋め込みを考える (ユークリッド空間でのこと) ポアンカレ空間上の距離が近いと大きくなる重み 6/17

Slide 7

Slide 7 text

知識グラフの活用近傍の情報を集約すれば良いが、曲がっている空間で重み付き集約できるのか提案手法: hyperbolic attention [知見1] 双極空間モデルの1つであるクライン円盤モデルでは、Einstein midpoint という名前のものが存在することが知られている [知見2] クライン円盤モデル( )とポアンカレボール( )は対応関係がある対応関係は 7/17

Slide 8

Slide 8 text

知識グラフの活用（全体のロス）ポアンカレ埋め込みを学習するとき、知識グラフのデータを活用したい英語: "The goal is to transfer the inductive bias in KG to the item representation:" 乖離具合を評価するために、集約したものと学習している埋め込みベクトルとの距離を使う全体のロスは 8/17

Slide 9

Slide 9 text

(3) ハイパーパラメータに対処するためにバイレベル最適化を導入した 9/17

Slide 10

Slide 10 text

ロスのパラメータ化とバイレベル最適化これまでもロスをくっつけるタイプの枠組みはあったが [課題1] ハイパラの扱いが微妙だった (固定するとデータセットで異なる) [課題2] そもそもアイテムによっての強さが変わりそう [課題3] 学習が進んでいくとそもそもの調整がいりそう対策: ロスをパラメタライズする: . バイレベル最適化 (最適化が入れ子になったやつ。NASがとかもそう) に落とし込む内側 (inner): を固定したときの全体ロス最良なを求める外側 (outer): に対してランキングロス最良なを求める 10/17

Slide 11

Slide 11 text

バイレベル最適化を交互最適化と正則化を着けて解く入れ子になっていても勾配は近似できる近似関係を使って更新式を代用する (define a proxy function to link ...) あとはとを順番に更新する Adamを使う正則化も乗っている結局ハイパラは復活したけど、[課題 2]と[課題3] は対応できてそう 11/17

Slide 12

Slide 12 text

バイレベル最適化のブロック図 12/17

Slide 13

Slide 13 text

(4) 実験で性能を確認した 13/17

Slide 14

Slide 14 text

データセット・比較手法・結果推薦でよく出てくるデータセット: Amazon-book、Last-FM、Yelp2018 いずれも80%を学習データ (内10%がvalidation)に、20%をテストデータに評価指標: Recall@K と NDCG@K 比較手法 Factorization Machine とそのニューラルタイプ: MF/NMF 既存のKG活用手法: CKE (MF+TransR)/CFKG (TransE)/RippleNet/GC- MC (GCN)/KGAT 提案手法 Hyper-Know 14/17

Slide 15

Slide 15 text

Ablation BPR + E/H (Euclidean v.s. Hyperbolic) BPR + Att + E/H (Hyperbolic Attentionの比較) BPR + Avg + H (BPR + Att + H のAttをただの平均に置き換えた) Hyper-Know (全部) 15/17

Slide 16

Slide 16 text

計算時間・埋め込みの可視化効率的埋め込みを可視化した例 (3階層ぐらいを学習した) 16/17

Slide 17

Slide 17 text

まとめ (再掲) 推薦モデル + 知識グラフ推薦モデル: 過去のログから (未知) アイテムの評価値を推定する知識グラフ: 外部知識を表現する (e.g., 同じ監督の作品; directed_by) 著者らの4つの貢献 (3つの技術的な貢献+実験) (1) 双極空間を活用した推薦(RS)+知識グラフ(KG)を提案した (2) KGの情報を活用するためにアテンションのような構造を導入した (3) ハイパーパラメータに対処するためにバイレベル最適化を導入した (4) 実験で性能を確認した 17/17