ACL読み会＠名大「S2GSL Incorporating Segment to Syntactic Enhanced Graph Structure Learning for Aspect-based Sentiment Analysis」

9/30 ACL読み会2024 静岡大学狩野研究室 B3山口真

アスペクトベースの感情分析というタスク・本研究では以下のような例文を考える The atmosphere is unheralded, the service impeccable, but
the food terrible. ・文に対してアスペクト語と対応するオピニオン語のラベルを分類するタスクを行う ↳The atmosphere is unheralded 雰囲気は目立ったところなし(atmosphere : neutral) ↳the service impeccable サービスは非の打ちどころがない(service : positive) ↳the food terrible 食事はひどい(food : negative) ・ひとつの文に複数のラベルを付与するために以下の手法が検討されている手法１：係り受け木を利用した構文解析手法２：Attentionを利用した意味解析手法３：構文グラフと意味グラフを組み合わせるグラフベース →本研究では手法３で存在する課題について取り組んだ 1

課題：グラフへの無関係な文によるノイズ 2 ・構文グラフ構築の際に係り受けを利用する unheraldedからの係り受けを考えるとき terribleへの係り受けはノイズになる・意味グラフ構築の際にAttentionを利用する atomosphereの文を考えるとき serviceの文やfoodの文に関するセグメントの意味情報はノイズになる

アーキテクチャの全体外観 3 構文ノイズを考慮する学習意味ノイズを考慮する学習

セグメントを考慮した意味グラフの学習・Attentionを張る対象となるセグメントを動的に決定するためのマスク行列を導入する． 4 The atmosphere is unheralded, the service impeccable,
but the food terrible. 注目するウィンドウの左端を学習注目するウィンドウの右端を学習マスク行列 The atmosphere is unheralded, the service impeccable, but the food terrible. クエリマスク後の行列を得る

セグメントを考慮した意味グラフの学習・マスク行列による学習に加えて構成木を教師信号としてセグメント決定を学習する 5 同一セグメントに属するなら１そうでないなら０損失関数を得る Stanford dependencyをもとにした CRF Constituency
parserで構成木を得る

セグメントを考慮した意味グラフの学習 6 𝐴𝑆𝑒𝑆を集約関数とするグラフの中間表現を得る

係り受けを考慮したグラフの構築 7 Stanford Parserで係り受けを解析係り受け木から依存関係行列を得る依存関係行列から埋め込みを得る最終的な関係隣接行列を得る https://aclanthology.org/2022.emnlp-main.359/

係り受けを考慮したグラフの構築 8 関係隣接行列を線形変換する単純なAttention行列𝐴𝑎 を用意する構文関係行列を得る行列の和をとって構文を考慮した初期重み行列を得る

係り受けを考慮したグラフの構築 9 対角成分はノードがルートであるかを加味した次数行列それ以外は単に接続を示す隣接行列であることを考慮した重み行列 i番目のノードがルートであるかを示すスコア i番目のノードがルートかどうかの確率 𝑡𝑖 ∈ 0,1
はアスペクト語であるかどうかでこれによりルートノードのオピニオン語と与えられたアスペクト語に対する損失関数を得る

係り受けを考慮したグラフの構築 10 グラフ畳み込み対角成分：ルートノードスコアそれ以外：隣接行列の重み行列 𝐴𝑆𝑦𝐿を集約関数とするグラフの中間表現を得る

係り受けを考慮したグラフの構築 10 グラフ畳み込み対角成分：ルートノードスコアそれ以外：隣接行列の重み行列 𝐴𝑆𝑦𝐿を集約関数とするグラフの中間表現を得る https://aclanthology.org/2022.emnlp-main.359/

グラフ集約モジュールと最終的な損失関数 11

グラフ集約モジュールと最終的な損失関数 12 𝑦(𝑠,𝑎) はオピニオン語sとアスペクト語a から計算される感情の確率分布

実験：使用するデータセット 13 ・それぞれのデータセットはアスペクト語とオピニオン語を含む文からなっている・Laptop, Restaurant, MAMS「the restaurant was expensive, but
the menu was great」 →複数のオピニオン語とアスペクト語を含む文・Twitter「@baller: windows phone is not better than iOS!」 →オピニオン語となるスパンはひとつだが複雑単位:文

結果 14 ・Twitter以外のタスクで当時のSOTAを達成・Twitterに関しては対象となるアスペクト語が複雑なひとつであるために利点が反映されなかった

アブレーション：各モジュールの効果・w/o SeSGに関してTwitter以外の３つのスコアが大きく下がった． →文構造が形式的かつひとつの文に複数の従属節が含まれるから →セグメントでマスクした利点が出ている 15

分析１：教師信号の効果・セグメント考慮の損失関数を導入しない方は誤った重みを割り当てている →セグメントでのマスク＋教師信号の利点が出ている 16

分析２：構文依存ラベルの効果 (a)では appetizers ←(nsubj)← ok service ←(nsubj)← slow のようにアスペクト語によくある依存関係を学習できた
ことにより(b)のようによりアスペクト語の重みが上昇した 17

分析３：集約モジュールの効果・提案手法では各モジュールのAttentionに対してそれぞれのQueryと(Key, Value)を Cross-Attentionの容量で計算した単純なSumやConcatと比較した際により性能が良いことが分かった．またタスクによって最適な戦略が変わることから直接的な融合戦略ではなく適応的なモジュール融合の利点が出ることが期待できる 18

分析４：ChatGPTとの比較・戦略１：ゼロショット「文に対して与えられたアスペクト語に対応する感情を[positive, negative, neutral]から感情を選んでください」・戦略２：単一アスペクト語の5-shot １に加えて５つの例を与えた．ただしそれぞれはひとつのアスペクト語のみ持つ・戦略３：複数アスペクト語の5-shot １に加えて５つの例を与えた．ただしそれぞれは複数のアスペクト語を持つ
19

分析５：構成木層の数の効果層の数の比較４層が最良だった 20

まとめ・アスペクトベースの感情分析において局所的にAttentionを張る手法を提案した・セグメントを考慮して学習するモジュールと係り受けを考慮して学習するモジュールのふたつを提案した・ふたつのモジュールを効果的に統合するシステムを提案した・対象アスペクトに無関係な単語をGCNを用いて明確に考慮することで従来手法よりも良好な性能を示した限界複雑な構文に対応できない 21

簡単なGNNの解説 e1 x0 x2 x1 x3 x4 次数行列Dと隣接行列Aからラプラシアン行列Lを得る．本研究ではノードの重みをD，エッジの重みをAで考えている

簡単なGNNの解説 x0 x2 x1 x3 x4 グラフの学習は特徴ベクトルを集約関数で畳み込む例えば集約関数Aが単純な隣接ノードの和集約で Wが重みを与える線形変換であるときグラフの中間表現hは
ℎ𝑛 = 𝜎(𝑠𝑢𝑚 (𝑊 ℎ𝑛−1 ) + 𝑏𝑛 ) のようになる GNNではこのように周囲の情報を集約することによって学習を進める ←ℎ0 = 𝜎 𝑊 𝑥0 + 𝑥1 + 𝑥3 + 𝑥4 + 𝑏0 e2

ACL読み会＠名大「S2GSL Incorporating Segment to Syntac...

ACL読み会＠名大「S2GSL Incorporating Segment to Syntactic Enhanced Graph Structure Learning for Aspect-based Sentiment Analysis」

Shin Yamaguchi

Featured

Transcript