深層強化学習を用いたノード分類 / Deep Reinforcement Learning For Node Classification

セッション番号: E14-3 柳田雄輝(筑波大学)，加藤誠(筑波大学) 深層強化学習を用いたノード分類 2021-03-01 第13回データ工学と情報マネジメントに関するフォーラム(DEIM2021)

ノード分類手法は重要背景 2 • グラフ構造は様々な対象をモデル化可能 • 分子 (ノード: 原子エッジ:
結合) • SNS (ノード: ユーザ，投稿エッジ: いいね，フォロー) • ノード分類手法を適用することで，ユーザ行動や分子の反応などの予測や改善が可能となるつくばなう 1億円 GET! SNSのネットワークユーザ投稿 post post like follow グラフで表現雨だ！つくばなうユーザ B 1億円 GET! ユーザ A SNSのグラフ B A 雨だ！

• ニューラルネットワークを用いたノード分類手法が広く提案されている [1][2] ◦ 隣接ノードの特徴を重み付けしつつ集約，ノードを分類する手法 (GAT: Graph Attention Network)が提案されている
[3] • スパム判定の例 [1] Kipf et al. Semi-supervised classification with graph convolutional networks. Proceedings of the 5th International Conference on Learning Representations. 2017. [2] Hamilton et al. Inductive representation learning on large graphs. Advances in neural information processing systems. 2017. [3] Veličković et al. GRAPH ATTENTION NETWORKS. Proceedings of the 6th International Conference on Learning Representations. 2018. 関連研究: ノード分類 3 雨だ！つくばなうユーザ B 1億円 GET! ユーザ A 出力ユーザAはスパム SNSのグラフノードラベルの予測結果予測ノード -0.2 +0.6 +0.1

既存のノード分類手法では2点の限界がある 1. グラフ内の多くのノードについて計算する必要がある 2. 分類の予測を妨げる情報も含んでしまう可能性がある関連研究: 既存のノード分類手法の限界 4 出力出力
ニューラルネットワークニューラルネットワーク出力ニューラルネットワーク出力ニューラルネットワークグラフ内の多くのノードについて計算する必要がある分類の予測を妨げる情報雨だ！ユーザ B 1億円 GET! ユーザ A つくばなう SNSのグラフ予測ノードユーザAはスパムノードラベルの予測結果ユーザ A ユーザ A ユーザ A 雨だ！ユーザ B つくばなう 1億円 GET!

︙ • ノードを選択的に探索し，計算するノードを絞るグラフ分類手法(GAM: Graph Attention Model)が提案されている [4] ◦ 強化学習によって各ノードを起点にグラフを探索，たどった
ノードの埋め込みを入力としてグラフラベルを予測 [4] Lee et al. Graph classification using structural attention. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018. 関連研究: ノードを選択的に探索する既存手法 5 4 5 2 1 3 1 3 1 2 1 4 5 4 1 ニューラルネットワークニューラルネットワークニューラルネットワーク出力出力出力ニューラルネットワーク出力分子は有害分子のグラフ各ノードを起点としてたどったノードグラフラベルの予測結果

• 既存のノード分類手法(GAT)では，多くのノードについて計算する必要がある • ノードを選択的に探索することにより計算するノードを絞るグラフ分類手法(GAM)が提案されている • 本研究ではノードを選択的に探索し，かつGATとは異なる分類根拠を表現できるノード分類手法を提案関連研究:
既存手法との比較 6 分類対象計算ノード数説明可能性 GAT ノード多隣接ノードの重み GAM グラフ少パス本研究の目的ノード少パラメータとパス既存手法との比較

分類に用いるノードを探索可能とするノード分類手法を提案本研究の目指すところ 7 出力ユーザAはスパムノードラベルの予測結果探索で得た分類根拠 1億円GET!を根拠に
ユーザAをスパムとして分類 • 計算するノードを探索したノードのみに絞ることを可能とする • 分類の過程で得たパスをノード分類の根拠として用いる 1. パスを用いることで多様な分類根拠を表現可能に 2. どのようなノードを根拠にノードが分類されたかを明らかにする雨だ！ユーザ B 1億円 GET! ユーザ A つくばなう SNSのグラフ予測ノードユーザ B 1億円 GET! ユーザ A

をたどらずに予測 • 分類対象のノードを起点に，強化学習のエージェントがグラフを探索 • エージェントkは，ラベルがクラスkに属する可能性が高いと判断した場合にsuccessという特殊な判断を下す ◦ エージェントはラベルの種類ごとに存在 ◦ successと判断した回数の多いエージェントのラベルを採用
• エージェントは自身のクラスを担当するように探索しないと報酬をもらえないようにすることで，各エージェントが根拠となるパスをたどるように動作させる手法のアイデア 8 エージェント0 エージェント1 ︙ ︙ 1 3 1 3 0と予測 1 4 5 2 1 3 1 4 1 3 1 4 3 1 1回success 8回success success 2 6 3 6 5 1 4 success 5 の後にクラス0に属する可能性が高いと判断 1 4 5

強化学習の設定 9 学習方法 Q学習状態たどってきたノードの情報ノードラベル，ノード埋め込み行動選択したエッジおよびsuccessからなる集合 ε-greedy法に基づき行動を決定
人工的に作成した2種類のグラフデータで実験 1. ノードとエッジがラベルを持つグラフ 2. ノードが特徴量を持つグラフ

遷移確率の計算(ノードとエッジがラベルを持つグラフ) 10 0 2 現在のノードラベルを表す one-hotベクトル各ノードラベルのたどった回数を表すベクトル 1 0
0 2 1 0 softmax 現在の状態を表すベクトルを線形変換して足し合わせる 0.2 0.0 0.1 𝟎. 𝟕 採用確率エッジラベルエッジ 0 エッジ 1 エッジ 2 success エージェントは successと判断 −0.2 0.1 0.2 0.6 0.4 −0.3 0.1 0.8 線形変換線形変換足すサンプリング success たどってきたノードエッジラベル例 ? ノードラベルに基づき解釈可能なモデルを作成次に選択するエッジラベルを決定線形変換を用いることで，分類に寄与する成分を明らかにする softmax関数の出力をもとに行動をサンプリングベクトルの各成分が各エッジラベルの採用確率に対応

• 100個のノードの未知ラベルを予測する2値分類問題 ◦ ノードとエッジのラベルに基づいてノードを探索 ◦ 次のように予測するのが最適となるようにデータを設計 • エッジラベルを 1→2 とたどった先のノードが，
◦ 黒なら未知ラベルは0 ◦ 赤なら未知ラベルは1 ◦ 分類精度: 1.00 実験1(ノードとエッジがラベルを持つグラフへの適用) 11 0 0 0 0 0 1 1 2 2 2 このノードの未知ラベル(0)を予測遷移事例 0 0 0 1 1 2 2 2 →未知ラベルは0と予測 0 エッジラベル

実験1でのエージェント0の事例 12 success 2 2 2 3 0 1 0
3 0 0 0.002 0.998 0.001 0.999 0.003 0.997 エッジラベルノードラベルエッジラベルの採用確率このノードの未知ラベルを予測エージェント0はエッジラベルを1→2とたどった後にsuccessを採用(ラベル0と予測) エッジラベルの採用しやすさエージェント0は黒のノードラベルをたどるとsuccessを採用する確率が高い遷移事例各エッジラベルの採用しやすさエージェント0はエッジラベルと黒のノードラベルを根拠に未知ラベルを予測しており，最適な行動を採用できている 0 1 2 3 4 エッジラベル

遷移確率の計算(ノードが特徴量を持つグラフ) 13 出力たどってきたノード例ノードが持つ特徴量に基づき解釈可能なモデルを作成次に遷移するノードを決定 ? 採用確率
遷移先ノード 0 ノード 1 エージェントはノード1へ遷移サンプリングノード1 0.2 𝟎. 𝟕 0.1 現在のノードの埋め込み各隣接ノードの特徴量開始ノードたどってきたノードの平均出力隣接ノードへの遷移確率 successの採用確率結合して softmax success ベクトルの各成分が各隣接ノードの採用確率に対応

• 100個のノードの未知ラベルを予測する2値分類問題 ◦ ラベルを持たないグラフに対しては，ノードの特徴量に基づいてノードを探索 ◦ 次のように予測するのが最適となるようにデータを設計 • 特徴量が大きい次元を 2→0
とたどったなら未知ラベルは0 • 特徴量が大きい次元を 2→1 とたどったなら未知ラベルは1 ◦ 分類精度: 0.60 (開始ノードの影響を強く受けたと考えられる) 実験2(ノードが特徴量を持つグラフへの適用) 14 0 特徴量ベクトル遷移事例このノードの未知ラベル(0)を予測 →未知ラベルは 0と予測

success 0.266 0.135 0.137 0.229 0.256 0.020 0.277 0.129 0.238
実験2 (ノードが特徴量を持つグラフへの適用)でのエージェント1の事例 15 このノードの未知ラベルを予測エージェント1は特徴量が大きい次元を2→0とたどった後にsuccessを採用していないエージェント1のsuccessの採用確率はたどった特徴量の1次元目に強く依存遷移事例特徴量ベクトルの各次元がsuccessの採用確率に与える影響の大きさノードへの遷移確率開始ノードの特徴量たどったノードの特徴量の平均エージェント1はたどった特徴量の1次元目を根拠に未知ラベルを予測しており，最適な行動を採用しているエージェント1は，特徴量が大きい次元を 2→1とたどった場合にsuccessすべき

• 分類に用いるノードを探索可能とするノード分類手法を提案 ◦ どのようなノードを根拠にノードが分類されたかを明らかにする • 実験の結果，従来手法とは異なる分類根拠の可視化に成功 • 分類対象のノードを起点にグラフを探索 ◦ エージェントkは，ラベルがクラスkに属する可能性が高いと判断
した場合にsuccessという特殊な判断を下す ◦ successと判断した回数の多いエージェントのラベルを採用 • エージェントは自身のクラスを担当するように探索しないと報酬をもらえないようにすることで，各エージェントが，根拠となるパスをたどるように動作させる • 今後の課題: 一般のグラフデータセットへの適用まとめ 16

補足資料

隣接ノードの集約例 18 例 A B C 特徴量を持ったノード NN A B
C グラフ構造を加味した特徴量を持ったノード • グラフにNN(ニューラルネットワーク)を適用した例 • ノードが持つ各特徴量について，グラフ構造を加味した特徴量となるように計算する

次の状態で理想的な遷移をした場合に期待される報酬と，実際の遷移で期待される報酬の差を最小化学習方法(Q学習) 19 • 𝑬 𝒔𝒕 , 𝒂𝒕 :
損失関数 ◦ 学習を安定させるため，𝐸の絶対値が1未満の場合は𝐸! ，それ以外では 𝐸 を損失とする • 𝒔𝒕 : 現在の状態(たどってきたノードの情報) • 𝒂𝒕 : 採用した行動(選択したエッジ) • 𝒓𝒕"𝟏 : 次の状態へ遷移するときに得る報酬 • 𝑸: 行動価値関数 ◦ 行動価値関数: 将来的に得られることが期待される報酬を表す関数 ◦ 𝑚𝑎𝑥" 𝑄: 理想的な行動𝑎を採用したときに得られる𝑄 𝐸 𝑠1 , 𝑎1 = 𝑟123 + 𝑚𝑎𝑥4 𝑄 𝑠123 , 𝑎1 − 𝑄 𝑠1 , 𝑎1 実際の期待報酬次の状態での理想的な期待報酬

• エージェントkについて，開始ノードのラベルがクラスkに属する場合 ◦ successを採用した場合には正の報酬を与え，successを採用せずに規定回数遷移した場合には負の報酬を与える • 開始ノードのラベルがクラスkに属する場合はsuccessを採用する回数が多い方が望ましい •
エージェントkについて，開始ノードのラベルがクラスkに属さない場合 ◦ successを採用した場合には負の報酬を与え，success以外の行動を採用した場合には 1 / 規定回数の報酬を与える • 開始ノードのラベルがクラスkに属さない場合は，success以外の行動を採用し続けることが望ましい報酬の設計 20

他のヒートマップ 21 実験1，エージェント1 実験2，エージェント0 エージェント1は黒のノードラベルをたどるとsuccessを採用する確率が高いエッジラベルノードラベルエッジラベルの
選択しやすさエージェント0のsuccessの採用確率はたどってきた特徴量の0次元目に強く依存特徴量ベクトルの各次元がsuccessの採用確率に与える影響の大きさ各エッジラベルの採用しやすさ開始ノードの特徴量たどったノードの特徴量の平均

深層強化学習を用いたノード分類 / Deep Reinforcement Learning F...

深層強化学習を用いたノード分類 / Deep Reinforcement Learning For Node Classification

YANAGIDA Yuki

More Decks by YANAGIDA Yuki

Other Decks in Research

Featured

Transcript

セッション番号: E14-3 柳田雄輝(筑波大学)，加藤誠(筑波大学) 深層強化学習を用いたノード分類 2021-03-01 第13回データ工学と情報マネジメントに関するフォーラム(DEIM2021)

ノード分類手法は重要背景 2 • グラフ構造は様々な対象をモデル化可能 • 分子 (ノード: 原子エッジ:

• ニューラルネットワークを用いたノード分類手法が広く提案されている [1][2] ◦ 隣接ノードの特徴を重み付けしつつ集約，ノードを分類する手法 (GAT: Graph Attention Network)が提案されている

既存のノード分類手法では2点の限界がある 1. グラフ内の多くのノードについて計算する必要がある 2. 分類の予測を妨げる情報も含んでしまう可能性がある関連研究: 既存のノード分類手法の限界 4 出力出力

︙ • ノードを選択的に探索し，計算するノードを絞るグラフ分類手法(GAM: Graph Attention Model)が提案されている [4] ◦ 強化学習によって各ノードを起点にグラフを探索，たどった

分類に用いるノードを探索可能とするノード分類手法を提案本研究の目指すところ 7 出力ユーザAはスパムノードラベルの予測結果探索で得た分類根拠 1億円GET!を根拠に

強化学習の設定 9 学習方法 Q学習状態たどってきたノードの情報ノードラベル，ノード埋め込み行動選択したエッジおよびsuccessからなる集合 ε-greedy法に基づき行動を決定

遷移確率の計算(ノードとエッジがラベルを持つグラフ) 10 0 2 現在のノードラベルを表す one-hotベクトル各ノードラベルのたどった回数を表すベクトル 1 0

• 100個のノードの未知ラベルを予測する2値分類問題 ◦ ノードとエッジのラベルに基づいてノードを探索 ◦ 次のように予測するのが最適となるようにデータを設計 • エッジラベルを 1→2 とたどった先のノードが，

実験1でのエージェント0の事例 12 success 2 2 2 3 0 1 0

遷移確率の計算(ノードが特徴量を持つグラフ) 13 出力たどってきたノード例ノードが持つ特徴量に基づき解釈可能なモデルを作成次に遷移するノードを決定 ? 採用確率

success 0.266 0.135 0.137 0.229 0.256 0.020 0.277 0.129 0.238

補足資料

隣接ノードの集約例 18 例 A B C 特徴量を持ったノード NN A B

次の状態で理想的な遷移をした場合に期待される報酬と，実際の遷移で期待される報酬の差を最小化学習方法(Q学習) 19 • 𝑬 𝒔𝒕 , 𝒂𝒕 :

他のヒートマップ 21 実験1，エージェント1 実験2，エージェント0 エージェント1は黒のノードラベルをたどるとsuccessを採用する確率が高いエッジラベルノードラベルエッジラベルの