論文紹介2022後期（EMNLP2022）_Towards Opening the Black Box of Neural Machine Translation: Source and Target Interpretations of the Transformer

発表者: 小町研 M2 今藤誠一郎 2022/12/19 @論文紹介2022 後期（EMNLP 2022） 1

概要 2 • NMTモデルの解釈可能性について，全ての入力（src 文と preﬁx）がモデルの予測に与える影響を追跡する手法（ALTI+）を提案． • ALTI+を用いて Transformer
ベースのモデル（bi-lingual, multi-lingual）に適用して NMT モデルの挙動を分析した ◦ 入力文の <EOS> には src の情報を利用しないように促す効果がある ◦ hallucination を生成する時には src の貢献度が低い ◦ 英語→low-resource 言語の翻訳時は src の貢献度が低い

関連研究 • Analyzing the Source and Target Contributions to Predictions
in Neural Machine Translation [Voita et al., ACL 2021] 🔗 ◦ Layer-wise Relevance Propagation (LRP) を用いた分析 ◦ 文長を揃えたコーパス単位でしか分析ができない → 本研究では文単位でも分析できる手法 • Measuring the Mixing of Contextual Information in the Transformer [Ferrando et al., EMNLP 2022] 🔗 ◦ ALTI (Aggregation of Layer-wise Tokens Attributions) を用いてBERT や RoBERTa を分析 ◦ 本研究はこの手法を Seq2Seq Transformer モデルに拡張（ALTI+） 3

ALTI • 各エンコーダ層で埋め込み表現が生成される際に，入力の各トークンがそれぞれどれだけ貢献しているのかを計算して集計． → エンコーダの入出力トークン間での貢献度 • 前準備 ◦ Multi-head
Attention を式変形 ◦ Layer normalization を式変形 4 各ヘッドの出力 : a の区分行列

ALTI • 各エンコーダ層で埋め込み表現が生成される際に，入力の各トークンがそれぞれどれだけ貢献しているのかを計算して全層を集計する． → エンコーダの入出力における埋め込み表現間での貢献度 5 等価 Transformer のエンコーダ層
の生成には　　が最も貢献している

ALTI • 前準備 ◦ Transformerモデルのエンコーダ層における入出力関係を改めて式で表現 ◦ Multi-head Attention を式変形 ◦
Layer normalization の式に代入 6 各ヘッドの出力 : a の区分行列

ALTI • 出力ベクトルを入力トークンごとの成分に分解 ◦ Layer Normalization が　　　　　　　に変換できることを利用 → • 入力
　が出力に与える影響をマンハッタン距離で表現 → 貢献度を以下で定義 7 （　　　　　　　　　　　）残差接続 ※ （　　　　　　　　　）：距離が大きいほど影響が小さくなる項

ALTI • 層ごとの貢献度を集計 ◦ Transformer の情報の流れを有向非巡回グラフに基づいてモデリングするアプローチを利用 ▪ ノード：トークン ▪ エッジ：入力が出力に与える影響（　　　）
◦ 異なる層におけるノードからノードへの計算はパスの総和で計算 ◦ 層から層は積で計算 → 8 先行研究より CLSから　　への計算のイメージ

ALTI＋ • Seq2Seq モデルへの拡張 • デコーダの入出力を ALTI 同様分割 ◦ Self
Attention ▪ エンコーダと同じ ▪ タイムステップtごとに ◦ Cross Attention ▪ ▪ エンコーダからの入力とデコーダの Self Attention 層から来る残差接続を分けるだけ → ▪ 　の　への貢献は Self Attention の全ての影響を含んでいる → をタイムステップ（行）ごとに残差結合分の貢献で重み付けして置き換える 9 （　　　　　　　　　）

ALTI＋ • 層ごとの貢献度を集計 ◦ エンコーダ入力の貢献 ▪ 層ごとにエンコーダからの入力があることを考慮して集計する必要 ◦
デコーダ入力の貢献 ▪ ALTIと同様 10 一個下の層までの集計結果

実験 • Bi-lingual と Multi-lingual の設定で実験 ◦ Bi-lingual : 6層の
Transformer，De-En タスク ▪ Europarl v7 で学習 ◦ Multi-lingual: M2M Transformer（Fan et al., 2021） ▪ Fairseq で公開されているモデル • IWSLT’14 GermanEnglish dataset の 1,000 文を用いて定量分析 11

分析　エンコーダ層で情報が混合されてしまう？ • Brunner et al. (2020) はエンコーダベースのモデルにおいて，入力ソーストークンは対応する最終層の表現（エンコーダ出力）にはほとんど（平均10％程度）寄与しないと結論付けた ↔ 線形分類器を学習し、コサイン類似度に基づく最近傍探索を行うことで、93%の入力トークンを復元可能
• ALTI を用いて貢献度を分析 → 最終層では、入力貢献度の41%が同じ位置の入力トークンから得られている • Voita et al. (2019) の結果と類似 12

分析　Cross-Attention における貢献度の評価 • 人手アライメントに対する貢献度の Alignment Error Rate (AER) で評価 •
Garg et al. の主張に基づいて最後から2番目の層（Bi-lingual モデルの第5層）を利用 13 先行研究の Attention の重みを利用する手法では </s>に集まってしまい，ノイズになっている提案手法では</s>の貢献度はなくなっている

分析　End-of-Sentence トークンの役割について • Ferrando and Costa-jussà (2021) の先行研究 ◦ “</s>”
や “.” の Value ベクトルは 0 ノルムに近い ◦ “</s>” や “.” への Attention の重みは preﬁx に基づいて予測する時（接置詞，接辞，subword の末尾等）に大きくなる傾向 • 2つ目の主張を検証 ◦ “</s>” におけるAttention の重みと提案手法にの残差接続部分における貢献度でピアソンの相関係数を測る（前ページ (a) と (b) の一番右の列） 14 • ほぼ全ての層で高い相関 • 文を終了させるトークンは src への Attention をスキップするのに利用

分析　Hallucinations • 出力の先頭に <unk> トークンを追加して Hallucination を誘発させる • Hallucination が発生した時に
ALTI+ ふぉ用いて分析る ◦ オリジナルのBLEUが20以上かつ，摂動を加えた時に3以下の時 15 src の貢献度はほぼ0

分析　多言語モデル • 複数の言語対で実験 ◦ High-resource: English (En), Spanish (Es), French
(Fr) ◦ Low-resource: Zulu (Zu) and Xhosa (Xh) • 言語タグの貢献度の分布（preﬁx 2列目）はほぼ一様 ◦ 固有名詞の生成時は下がる傾向 → どの言語でも同じ表現だから言語を気にする必要がないため？ • 出力単語の依存関係も見える ◦ “for” 生成時の ”thanks” ◦ “Williams” 生成時の “Mr” ◦ “into” 生成時の “introducing” 16

分析　多言語モデル • 言語対ごとの src の貢献度 17 • ほとんどのペアは似たような傾向 • High-resource
から Low-resource の設定のみ src の貢献度が低い ◦ Low-resource 言語が preﬁx になると Hallucination の実験の時と同様な現象が起きているため？

まとめ • Transformer ベースの Seq2Seq モデルを分析する手法 ALTI+ を提案 • 入力文の貢献度を
src と preﬁx の両方の観点から分析 • Bi-lingual モデルと Multi-lingural モデルに適用し，モデルの挙動に関する洞察を得ることができた 18

論文紹介2022後期（EMNLP2022）_Towards Opening the Black...

論文紹介2022後期（EMNLP2022）_Towards Opening the Black Box of Neural Machine Translation: Source and Target Interpretations of the Transformer

maskcott

More Decks by maskcott

Featured

Transcript

発表者: 小町研 M2 今藤誠一郎 2022/12/19 @論文紹介2022 後期（EMNLP 2022） 1

概要 2 • NMTモデルの解釈可能性について，全ての入力（src 文と preﬁx）がモデルの予測に与える影響を追跡する手法（ALTI+）を提案． • ALTI+を用いて Transformer

関連研究 • Analyzing the Source and Target Contributions to Predictions

ALTI • 各エンコーダ層で埋め込み表現が生成される際に，入力の各トークンがそれぞれどれだけ貢献しているのかを計算して集計． → エンコーダの入出力トークン間での貢献度 • 前準備 ◦ Multi-head

ALTI • 前準備 ◦ Transformerモデルのエンコーダ層における入出力関係を改めて式で表現 ◦ Multi-head Attention を式変形 ◦

ALTI • 出力ベクトルを入力トークンごとの成分に分解 ◦ Layer Normalization が　　　　　　　に変換できることを利用 → • 入力

ALTI • 層ごとの貢献度を集計 ◦ Transformer の情報の流れを有向非巡回グラフに基づいてモデリングするアプローチを利用 ▪ ノード：トークン ▪ エッジ：入力が出力に与える影響（　　　）

ALTI＋ • Seq2Seq モデルへの拡張 • デコーダの入出力を ALTI 同様分割 ◦ Self

ALTI＋ • 層ごとの貢献度を集計 ◦ エンコーダ入力の貢献 ▪ 層ごとにエンコーダからの入力があることを考慮して集計する必要 ◦

実験 • Bi-lingual と Multi-lingual の設定で実験 ◦ Bi-lingual : 6層の

分析　Cross-Attention における貢献度の評価 • 人手アライメントに対する貢献度の Alignment Error Rate (AER) で評価 •

分析　End-of-Sentence トークンの役割について • Ferrando and Costa-jussà (2021) の先行研究 ◦ “</s>”

分析　Hallucinations • 出力の先頭に <unk> トークンを追加して Hallucination を誘発させる • Hallucination が発生した時に

分析　多言語モデル • 複数の言語対で実験 ◦ High-resource: English (En), Spanish (Es), French

分析　多言語モデル • 言語対ごとの src の貢献度 17 • ほとんどのペアは似たような傾向 • High-resource

まとめ • Transformer ベースの Seq2Seq モデルを分析する手法 ALTI+ を提案 • 入力文の貢献度を