DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction

文献紹介： DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction
Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Long Papers), pages 496–505 Melbourne, Australia, July 15 - 20, 2018. 長岡技術科学大学勝田哲弘

Abstract • Distant supervisoins ◦ 外部データから効果的にラベルを付けることができる ◦ ラベルにノイズがあることが問題 • DSGAN
◦ Generative Adversarial Networkを用いてデータセットのクリーニング ◦ 生成器の出力を負例として判別器を学習 2

Introduction • Relation extraction ◦ 文中のentityペア間の関係を予測する ◦ 例： The [owl]
held the mouse in its [claw]. ▪ Component-Whole • DSによるデータの生成 ◦ ノイズが多く含まれるため、ノイズ除去が課題 3

Adversarial Learning for Distant Supervision 4

Adversarial Learning for Distant Supervision 1. DSからデータセット作成 2. True
Positive (high), False Positive (low)をG に抽出させる 5

Adversarial Learning for Distant Supervision 1. DSからデータセット作成 2. True Positive
(high), False Positive (low)をGに抽出させる 3. DはGのTPを負例として学習（GがTPを抽出する能力が上がるほどDの性能は下がる） 6

Pre-Training Strategy GANはPre-Trainingされたモデルのほうが収束しやすい DSデータセットからP, NG, NDを用意 • Discriminator: simple CNN　(P,
ND) ◦ Accuracyが90％を超えるまで学習 • Generator: simple CNN　(P, NG) ◦ Pにオーバーフィットさせる後に、GにFPの確率を徐々に減少させることを学ばせる。 7

DSGAN algorithm 8

Generator LGは離散サンプリングステップを含むため、勾配に基づくアルゴリズムで直接最適化ができない Policy Gradientに基づいて以下の確率を最大化する 9

Discriminator 以下のクロスエントロピー損失関数を最小化する各エポックの始めにPre-Trainingされたパラメータをロードする 1エポックでDのパフォーマンスが大きく低下 -> robustなG 10

Optimizing Generator Gの品質をより反映するために、2つの角度から報酬rを定義 1. Dでpositiveと判断されるpositive samplesの信頼度を最大化 2. ND上でDの分類精度を下げる(pの最大化) 11

Cleaning Noisy Dataset with Generator • 1つのrelationに対してGeneratorを1つ作成 • GeneratorでDSデータセットを分類 ◦
正例、負例に分割 12

Experiments • Reidel dataset ◦ distant supervision relation extraction dataset
• Freebase ◦ 数十億のtripleを含む知識ベース • New York Times corpus(NYT) • 評価 ◦ 対応するラベル付きデータセットないためHold-Outで評価 13

Training Process of DSGAN NDでDiscriminatorを評価 • 学習が進むにつれ、 Accuracyが下がる正負の分類精度を評価 •
それぞれの手法でクリーニングしたデータで学習 14

Performance Relation Extractionの精度 15

Conclusion • GANによるDistant Supervisionのノイズを除去する方法を提案 • タスクに依存しないため、あらゆるDistant Supervisionモデルに適用可 •
New York Time datasetで有意な向上が見られた 16

DSGAN: Generative Adversarial Training for Dist...

DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction

katsutan

More Decks by katsutan

Other Decks in Technology

Featured

Transcript

文献紹介： DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction

Abstract • Distant supervisoins ◦ 外部データから効果的にラベルを付けることができる ◦ ラベルにノイズがあることが問題 • DSGAN

Introduction • Relation extraction ◦ 文中のentityペア間の関係を予測する ◦ 例： The [owl]

Adversarial Learning for Distant Supervision 4

Adversarial Learning for Distant Supervision 1. DSからデータセット作成 2. True

Adversarial Learning for Distant Supervision 1. DSからデータセット作成 2. True Positive

Pre-Training Strategy GANはPre-Trainingされたモデルのほうが収束しやすい DSデータセットからP, NG, NDを用意 • Discriminator: simple CNN　(P,

DSGAN algorithm 8

Generator LGは離散サンプリングステップを含むため、勾配に基づくアルゴリズムで直接最適化ができない Policy Gradientに基づいて以下の確率を最大化する 9

Discriminator 以下のクロスエントロピー損失関数を最小化する各エポックの始めにPre-Trainingされたパラメータをロードする 1エポックでDのパフォーマンスが大きく低下 -> robustなG 10

Optimizing Generator Gの品質をより反映するために、2つの角度から報酬rを定義 1. Dでpositiveと判断されるpositive samplesの信頼度を最大化 2. ND上でDの分類精度を下げる(pの最大化) 11

Cleaning Noisy Dataset with Generator • 1つのrelationに対してGeneratorを1つ作成 • GeneratorでDSデータセットを分類 ◦

Experiments • Reidel dataset ◦ distant supervision relation extraction dataset

Training Process of DSGAN NDでDiscriminatorを評価 • 学習が進むにつれ、 Accuracyが下がる正負の分類精度を評価 •

Performance Relation Extractionの精度 15

Conclusion • GANによるDistant Supervisionのノイズを除去する方法を提案 • タスクに依存しないため、あらゆるDistant Supervisionモデルに適用可 •