深層強化学習を用いたノード分類 / Deep Reinforcement Learning For Node Classification

Slide 1

Slide 1 text

セッション番号: E14-3 柳田雄輝(筑波大学)，加藤誠(筑波大学) 深層強化学習を用いたノード分類 2021-03-01 第13回データ工学と情報マネジメントに関するフォーラム(DEIM2021)

Slide 2

Slide 2 text

ノード分類手法は重要背景 2 • グラフ構造は様々な対象をモデル化可能 • 分子 (ノード: 原子エッジ: 結合) • SNS (ノード: ユーザ，投稿エッジ: いいね，フォロー) • ノード分類手法を適用することで，ユーザ行動や分子の反応などの予測や改善が可能となるつくばなう 1億円 GET! SNSのネットワークユーザ投稿 post post like follow グラフで表現雨だ！つくばなうユーザ B 1億円 GET! ユーザ A SNSのグラフ B A 雨だ！

Slide 3

Slide 3 text

• ニューラルネットワークを用いたノード分類手法が広く提案されている [1][2] ○ 隣接ノードの特徴を重み付けしつつ集約，ノードを分類する手法 (GAT: Graph Attention Network)が提案されている [3] • スパム判定の例 [1] Kipf et al. Semi-supervised classification with graph convolutional networks. Proceedings of the 5th International Conference on Learning Representations. 2017. [2] Hamilton et al. Inductive representation learning on large graphs. Advances in neural information processing systems. 2017. [3] Veličković et al. GRAPH ATTENTION NETWORKS. Proceedings of the 6th International Conference on Learning Representations. 2018. 関連研究: ノード分類 3 雨だ！つくばなうユーザ B 1億円 GET! ユーザ A 出力ユーザAはスパム SNSのグラフノードラベルの予測結果予測ノード -0.2 +0.6 +0.1

Slide 4

Slide 4 text

既存のノード分類手法では2点の限界がある 1. グラフ内の多くのノードについて計算する必要がある 2. 分類の予測を妨げる情報も含んでしまう可能性がある関連研究: 既存のノード分類手法の限界 4 出力出力ニューラルネットワークニューラルネットワーク出力ニューラルネットワーク出力ニューラルネットワークグラフ内の多くのノードについて計算する必要がある分類の予測を妨げる情報雨だ！ユーザ B 1億円 GET! ユーザ A つくばなう SNSのグラフ予測ノードユーザAはスパムノードラベルの予測結果ユーザ A ユーザ A ユーザ A 雨だ！ユーザ B つくばなう 1億円 GET!

Slide 5

Slide 5 text

︙ • ノードを選択的に探索し，計算するノードを絞るグラフ分類手法(GAM: Graph Attention Model)が提案されている [4] ○ 強化学習によって各ノードを起点にグラフを探索，たどったノードの埋め込みを入力としてグラフラベルを予測 [4] Lee et al. Graph classification using structural attention. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018. 関連研究: ノードを選択的に探索する既存手法 5 4 5 2 1 3 1 3 1 2 1 4 5 4 1 ニューラルネットワークニューラルネットワークニューラルネットワーク出力出力出力ニューラルネットワーク出力分子は有害分子のグラフ各ノードを起点としてたどったノードグラフラベルの予測結果

Slide 6

Slide 6 text

• 既存のノード分類手法(GAT)では，多くのノードについて計算する必要がある • ノードを選択的に探索することにより計算するノードを絞るグラフ分類手法(GAM)が提案されている • 本研究ではノードを選択的に探索し，かつGATとは異なる分類根拠を表現できるノード分類手法を提案関連研究: 既存手法との比較 6 分類対象計算ノード数説明可能性 GAT ノード多隣接ノードの重み GAM グラフ少パス本研究の目的ノード少パラメータとパス既存手法との比較

Slide 7

Slide 7 text

分類に用いるノードを探索可能とするノード分類手法を提案本研究の目指すところ 7 出力ユーザAはスパムノードラベルの予測結果探索で得た分類根拠 1億円GET!を根拠にユーザAをスパムとして分類 • 計算するノードを探索したノードのみに絞ることを可能とする • 分類の過程で得たパスをノード分類の根拠として用いる 1. パスを用いることで多様な分類根拠を表現可能に 2. どのようなノードを根拠にノードが分類されたかを明らかにする雨だ！ユーザ B 1億円 GET! ユーザ A つくばなう SNSのグラフ予測ノードユーザ B 1億円 GET! ユーザ A

Slide 8

Slide 8 text

をたどらずに予測 • 分類対象のノードを起点に，強化学習のエージェントがグラフを探索 • エージェントkは，ラベルがクラスkに属する可能性が高いと判断した場合にsuccessという特殊な判断を下す ○ エージェントはラベルの種類ごとに存在 ○ successと判断した回数の多いエージェントのラベルを採用 • エージェントは自身のクラスを担当するように探索しないと報酬をもらえないようにすることで，各エージェントが根拠となるパスをたどるように動作させる手法のアイデア 8 エージェント0 エージェント1 ︙ ︙ 1 3 1 3 0と予測 1 4 5 2 1 3 1 4 1 3 1 4 3 1 1回success 8回success success 2 6 3 6 5 1 4 success 5 の後にクラス0に属する可能性が高いと判断 1 4 5

Slide 9

Slide 9 text

強化学習の設定 9 学習方法 Q学習状態たどってきたノードの情報ノードラベル，ノード埋め込み行動選択したエッジおよびsuccessからなる集合 ε-greedy法に基づき行動を決定人工的に作成した2種類のグラフデータで実験 1. ノードとエッジがラベルを持つグラフ 2. ノードが特徴量を持つグラフ

Slide 10

Slide 10 text

遷移確率の計算(ノードとエッジがラベルを持つグラフ) 10 0 2 現在のノードラベルを表す one-hotベクトル各ノードラベルのたどった回数を表すベクトル 1 0 0 2 1 0 softmax 現在の状態を表すベクトルを線形変換して足し合わせる 0.2 0.0 0.1 𝟎. 𝟕 採用確率エッジラベルエッジ 0 エッジ 1 エッジ 2 success エージェントは successと判断 −0.2 0.1 0.2 0.6 0.4 −0.3 0.1 0.8 線形変換線形変換足すサンプリング success たどってきたノードエッジラベル例 ? ノードラベルに基づき解釈可能なモデルを作成次に選択するエッジラベルを決定線形変換を用いることで，分類に寄与する成分を明らかにする softmax関数の出力をもとに行動をサンプリングベクトルの各成分が各エッジラベルの採用確率に対応

Slide 11

Slide 11 text

• 100個のノードの未知ラベルを予測する2値分類問題 ○ ノードとエッジのラベルに基づいてノードを探索 ○ 次のように予測するのが最適となるようにデータを設計 • エッジラベルを 1→2 とたどった先のノードが， ○ 黒なら未知ラベルは0 ○ 赤なら未知ラベルは1 ○ 分類精度: 1.00 実験1(ノードとエッジがラベルを持つグラフへの適用) 11 0 0 0 0 0 1 1 2 2 2 このノードの未知ラベル(0)を予測遷移事例 0 0 0 1 1 2 2 2 →未知ラベルは0と予測 0 エッジラベル

Slide 12

Slide 12 text

実験1でのエージェント0の事例 12 success 2 2 2 3 0 1 0 3 0 0 0.002 0.998 0.001 0.999 0.003 0.997 エッジラベルノードラベルエッジラベルの採用確率このノードの未知ラベルを予測エージェント0はエッジラベルを1→2とたどった後にsuccessを採用(ラベル0と予測) エッジラベルの採用しやすさエージェント0は黒のノードラベルをたどるとsuccessを採用する確率が高い遷移事例各エッジラベルの採用しやすさエージェント0はエッジラベルと黒のノードラベルを根拠に未知ラベルを予測しており，最適な行動を採用できている 0 1 2 3 4 エッジラベル

Slide 13

Slide 13 text

遷移確率の計算(ノードが特徴量を持つグラフ) 13 出力たどってきたノード例ノードが持つ特徴量に基づき解釈可能なモデルを作成次に遷移するノードを決定 ? 採用確率遷移先ノード 0 ノード 1 エージェントはノード1へ遷移サンプリングノード1 0.2 𝟎. 𝟕 0.1 現在のノードの埋め込み各隣接ノードの特徴量開始ノードたどってきたノードの平均出力隣接ノードへの遷移確率 successの採用確率結合して softmax success ベクトルの各成分が各隣接ノードの採用確率に対応

Slide 14

Slide 14 text

• 100個のノードの未知ラベルを予測する2値分類問題 ○ ラベルを持たないグラフに対しては，ノードの特徴量に基づいてノードを探索 ○ 次のように予測するのが最適となるようにデータを設計 • 特徴量が大きい次元を 2→0 とたどったなら未知ラベルは0 • 特徴量が大きい次元を 2→1 とたどったなら未知ラベルは1 ○ 分類精度: 0.60 (開始ノードの影響を強く受けたと考えられる) 実験2(ノードが特徴量を持つグラフへの適用) 14 0 特徴量ベクトル遷移事例このノードの未知ラベル(0)を予測 →未知ラベルは 0と予測

Slide 15

Slide 15 text

success 0.266 0.135 0.137 0.229 0.256 0.020 0.277 0.129 0.238 実験2 (ノードが特徴量を持つグラフへの適用)でのエージェント1の事例 15 このノードの未知ラベルを予測エージェント1は特徴量が大きい次元を2→0とたどった後にsuccessを採用していないエージェント1のsuccessの採用確率はたどった特徴量の1次元目に強く依存遷移事例特徴量ベクトルの各次元がsuccessの採用確率に与える影響の大きさノードへの遷移確率開始ノードの特徴量たどったノードの特徴量の平均エージェント1はたどった特徴量の1次元目を根拠に未知ラベルを予測しており，最適な行動を採用しているエージェント1は，特徴量が大きい次元を 2→1とたどった場合にsuccessすべき

Slide 16

Slide 16 text

• 分類に用いるノードを探索可能とするノード分類手法を提案 ○ どのようなノードを根拠にノードが分類されたかを明らかにする • 実験の結果，従来手法とは異なる分類根拠の可視化に成功 • 分類対象のノードを起点にグラフを探索 ○ エージェントkは，ラベルがクラスkに属する可能性が高いと判断した場合にsuccessという特殊な判断を下す ○ successと判断した回数の多いエージェントのラベルを採用 • エージェントは自身のクラスを担当するように探索しないと報酬をもらえないようにすることで，各エージェントが，根拠となるパスをたどるように動作させる • 今後の課題: 一般のグラフデータセットへの適用まとめ 16

Slide 17

Slide 17 text

補足資料

Slide 18

Slide 18 text

隣接ノードの集約例 18 例 A B C 特徴量を持ったノード NN A B C グラフ構造を加味した特徴量を持ったノード • グラフにNN(ニューラルネットワーク)を適用した例 • ノードが持つ各特徴量について，グラフ構造を加味した特徴量となるように計算する

Slide 19

Slide 19 text

次の状態で理想的な遷移をした場合に期待される報酬と，実際の遷移で期待される報酬の差を最小化学習方法(Q学習) 19 • 𝑬 𝒔𝒕 , 𝒂𝒕 : 損失関数 ○ 学習を安定させるため，𝐸の絶対値が1未満の場合は𝐸! ，それ以外では 𝐸 を損失とする • 𝒔𝒕 : 現在の状態(たどってきたノードの情報) • 𝒂𝒕 : 採用した行動(選択したエッジ) • 𝒓𝒕"𝟏 : 次の状態へ遷移するときに得る報酬 • 𝑸: 行動価値関数 ○ 行動価値関数: 将来的に得られることが期待される報酬を表す関数 ○ 𝑚𝑎𝑥" 𝑄: 理想的な行動𝑎を採用したときに得られる𝑄 𝐸 𝑠1 , 𝑎1 = 𝑟123 + 𝑚𝑎𝑥4 𝑄 𝑠123 , 𝑎1 − 𝑄 𝑠1 , 𝑎1 実際の期待報酬次の状態での理想的な期待報酬

Slide 20

Slide 20 text

• エージェントkについて，開始ノードのラベルがクラスkに属する場合 ○ successを採用した場合には正の報酬を与え，successを採用せずに規定回数遷移した場合には負の報酬を与える • 開始ノードのラベルがクラスkに属する場合はsuccessを採用する回数が多い方が望ましい • エージェントkについて，開始ノードのラベルがクラスkに属さない場合 ○ successを採用した場合には負の報酬を与え，success以外の行動を採用した場合には 1 / 規定回数の報酬を与える • 開始ノードのラベルがクラスkに属さない場合は，success以外の行動を採用し続けることが望ましい報酬の設計 20

Slide 21

Slide 21 text

他のヒートマップ 21 実験1，エージェント1 実験2，エージェント0 エージェント1は黒のノードラベルをたどるとsuccessを採用する確率が高いエッジラベルノードラベルエッジラベルの選択しやすさエージェント0のsuccessの採用確率はたどってきた特徴量の0次元目に強く依存特徴量ベクトルの各次元がsuccessの採用確率に与える影響の大きさ各エッジラベルの採用しやすさ開始ノードの特徴量たどったノードの特徴量の平均