SKIP-GRAPH: LEARNING GRAPH EMBEDDINGS WITH AN ENCODER-DECODER MODEL

R eview "SKIP ‑GRAPH : LEARNING GRAPH EMBEDDINGS WITH AN
ENCODER ‑ DECODER MODEL " C reated by T akeshi O ura

A genda SKIP ‑GRAPH : LEARNING GRAPH EMBEDDINGS WITH AN
ENCODER ‑DECODER MODEL ,L ee et al. 2016 (ICRL 2017 u nder r ev iew) グラフの埋め込み表現を抽出ノードを辿るランダムウォークとしてグラフを表現し RNN で系列の埋め込み表現を学習分子構造から性質を同定するタスクで評価

G raph グラフ中のノードに着目ノードのラベル付与問題クラスタリング、ユーザプロファイルの推定(s ns
など) グラフ中ノードの埋め込み表現 (D eep w alk by P er ozz i et al. 2014, line T ang et al. 2015, node2v ec by G r ov er et al.2016) グラフ全体に着目グラフ間類似度: gr ap h‑ker nel et c. コミュニティ抽出、サブグラフ分類、ラベル付与構文木からの推定、分子配列から構造、機能予測グラフ全体の埋め込み← 本論文一般のグラフ埋め込み表現でなくグラフとみなせる特定のタスク用(素性の提案)論文は多数

S ettings 入力: 複数のグラフ無向グラフラベルつきノードラベルつきエッジでもよい (この場合ノード，
エッジの系列を考える) ラベルは何らかの素性でよい出力: 各グラフのベクトル表現ラベルつきのノードにより構成させるグラフの構造を反映したい

I dea グラフの構造をランダムウォーカーによるノードの系列で表現ノードの列を入力としたencoder‑decoder モデルで内部表現を学習学習時のencoder‑decoder
モデルのs kip‑gr am(s eq ence入力 w or d2v ec) RNN としては GRU を使用 G r ap h lap lacianや S p ectru m met hodは扱わないがグラフ上のランダムウォークとは関係が深い

S kip though (K iros et al. 2015) docu ment
中のs ent enceの埋め込み表現を抽出 s kip‑gr amを同じアイデア: センテンスs = {w }から前のセンテンスs = {w }, 後のセンテンスs = {w }を予測目的関数: L = P(w ∣{w } , h ) + P(w ∣{w } , h ) P(w ∣{w } , h ) ∼ exp(v h ) V = {v }: 単語ごとに決まる重み行列 i i t i+1 i+1 t i−1 i−1 t t ∑ i+1 t i+1 t′ t <t ′ i t ∑ i−1 t i−1 t′ t <t ′ i i+1 t i+1 t′ t <t ′ i wi+1 t i+1 t w

S kip though (K iros et al. 2015) encoder: 普通の
GRU h : encoder の出力ベクトル decoder:h をバイアスに付加した GRU r = σ(W x + U h + C h ) z = σ(W x + U h + C h ) = tanh(W x + U (r z ⊙ h ) + Ch ) h = (1 − z ) ⊙ +z ⊙ i i t r d t−1 r d t−1 r i t z d t−1 z d t−1 r i h ¯t d t−1 d t t−1 i i+1 t t t h ¯t

S kip though (K iros et al. 2015) タスク s
emant ic r elat edness: 2つのセンテンスが意味的に類似しているか言い換え検出:2つのセンテンスが言いかえか否か識別 image‑s ent ence r anking: 与えられた画像(キャプション)に適切なキャプション(画像)をランキング文書識別: レビュー、意見の極性、質問の分類など

S kip‑graph vector s kip‑t hou ghをグラフ上のランダムウォークに適用 s kip‑gr
ap h: ランダムウォークsをs → s → s のように分解, sからs , s を予測評価では順向き, 逆向き2つのdecoder を使用, 目的関数は和をとる pre input post pre post

A lgrothm 1. 各グラフごとK個のランダムウォークを生成 2. ランダムウォークでencoder‑decoder を学習 3.
ベクトル表現抽出: i. 各グラフごとK 個のランダムウォークを生成 ii. encoder でベクトル表現を出力 iii. K 個のベクトル表現を合算ベクトル表現の合算方法 S ingle w alk: 十分に長い系列1つのみ生成し使う(K = 1) A v er age:次元ごとに平均 M ax: 次元ごとに M ax C lust er: k‑means → bu g of clust er ′ ′ ′

E valuation T as k: 化合物が与えられターゲットの病気に効果があるか2値識別する dat as
et: NCI 81, NCI 83, NCI 123, HIV 比較手法: ECFP : E xt ended‑connect iv ity cir cu lar fingerpr ints, 各ノードからk近傍の分子に着目し、 it er at iv eにノードの素性を更新し has h関数で固定長ベクトルに変換 N eur al FPS : ECFP をk近傍をまとめる処理を CNN にしたもの S kip‑gr ap h: 提案手法素性抽出後sv mで識別機を構築し予測精度を比較

R esults 既存手法との比較すべてのデータセットで既存手法を上回る method HIV NCI 81 NCI
83 NCI 123 ECFP 68.30% 68.90% 62.06% 60.16% N eur al FPS 67.48% 65.24% 59.91% 60.00% S kip‑gr ap h 71.76% 70.56% 64.04% 64.32% 合算方法の比較 S ingle w alkは非常に悪いそれ以外はだいたいよい

まとめグラフの埋め込み表現を抽出したグラフ構造をランダムウォークで表現系列の埋め込み表現を抽出するs kip‑t hou ght でランダムウォークか
ら埋め込み表現を学習化合物の機能予測タスクにおいて既存手法を上回る結果を得たランダムウォークの長さ30位がよいらしい重要な典型的スケールの事前知識長いスケールの構造をとらえるのは難しい?

SKIP-GRAPH: LEARNING GRAPH EMBEDDINGS WITH AN E...

SKIP-GRAPH: LEARNING GRAPH EMBEDDINGS WITH AN ENCODER-DECODER MODEL

takoika

More Decks by takoika

Other Decks in Science

Featured

Transcript

R eview "SKIP ‑GRAPH : LEARNING GRAPH EMBEDDINGS WITH AN

A genda SKIP ‑GRAPH : LEARNING GRAPH EMBEDDINGS WITH AN

G raph グラフ中のノードに着目ノードのラベル付与問題クラスタリング、ユーザプロファイルの推定(s ns

S ettings 入力: 複数のグラフ無向グラフラベルつきノードラベルつきエッジでもよい (この場合ノード，

I dea グラフの構造をランダムウォーカーによるノードの系列で表現ノードの列を入力としたencoder‑decoder モデルで内部表現を学習学習時のencoder‑decoder

S kip though (K iros et al. 2015) docu ment

S kip though (K iros et al. 2015) encoder: 普通の

S kip though (K iros et al. 2015) タスク s

S kip‑graph vector s kip‑t hou ghをグラフ上のランダムウォークに適用 s kip‑gr

A lgrothm 1. 各グラフごとK個のランダムウォークを生成 2. ランダムウォークでencoder‑decoder を学習 3.

E valuation T as k: 化合物が与えられターゲットの病気に効果があるか2値識別する dat as

R esults 既存手法との比較すべてのデータセットで既存手法を上回る method HIV NCI 81 NCI

まとめグラフの埋め込み表現を抽出したグラフ構造をランダムウォークで表現系列の埋め込み表現を抽出するs kip‑t hou ght でランダムウォークか