Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DSGAN: Generative Adversarial Training for Dist...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
katsutan
May 15, 2019
Technology
280
0
Share
DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction
文献紹介
長岡技術科学大学
勝田 哲弘
katsutan
May 15, 2019
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
240
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
220
Simple task-specific bilingual word embeddings
katsutan
0
220
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
270
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
220
Improving Word Embeddings Using Kernel PCA
katsutan
0
230
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
330
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
270
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
300
Other Decks in Technology
See All in Technology
「決め方」の渡し方 / How to hand over the "decision-making process"
pauli
8
1.3k
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.2k
主催・運営として"場をつくる”というアウトプットのススメ
_mossann_t
0
130
自分をひらくと次のチャレンジの敷居が下がる
sudoakiy
5
1.9k
【Findy FDE登壇_2026_04_14】— 現場課題を本気で解いてたら、FDEになってた話
miyatakoji
0
240
OCI技術資料 : 証明書サービス概要
ocise
1
7.2k
BIツール「Omni」の紹介 @Snowflake中部UG
sagara
0
240
Databricks Lakebaseを用いたAIエージェント連携
daiki_akimoto_nttd
0
170
バックオフィスPJのPjMをコーポレートITが担うとうまくいく3つの理由
yueda256
1
290
Webアクセシビリティは“もしも”に備える設計
tomokusaba
0
170
Strands Agents × Amazon Bedrock AgentCoreで パーソナルAIエージェントを作ろう
yokomachi
2
250
新規サービス開発におけるReact Nativeのリアル〜技術選定の裏側と実践的OSS活用〜
grandbig
2
120
Featured
See All Featured
Navigating Team Friction
lara
192
16k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
The Pragmatic Product Professional
lauravandoore
37
7.2k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
130
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
200
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
670
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
170
Ruling the World: When Life Gets Gamed
codingconduct
0
190
A designer walks into a library…
pauljervisheath
211
24k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.4k
Transcript
文献紹介: DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction
Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Long Papers), pages 496–505 Melbourne, Australia, July 15 - 20, 2018. 長岡技術科学大学 勝田 哲弘
Abstract • Distant supervisoins ◦ 外部データから効果的にラベルを付けることができる ◦ ラベルにノイズがあることが問題 • DSGAN
◦ Generative Adversarial Networkを用いてデータセットのクリーニング ◦ 生成器の出力を負例として判別器を学習 2
Introduction • Relation extraction ◦ 文中のentityペア間の関係を予測する ◦ 例: The [owl]
held the mouse in its [claw]. ▪ Component-Whole • DSによるデータの生成 ◦ ノイズが多く含まれるため、ノイズ除去が課題 3
Adversarial Learning for Distant Supervision 4
Adversarial Learning for Distant Supervision 1. DSからデータセット作 成 2. True
Positive (high), False Positive (low)をG に抽出させる 5
Adversarial Learning for Distant Supervision 1. DSからデータセット作成 2. True Positive
(high), False Positive (low)をGに抽出させる 3. DはGのTPを負例として学習(GがTPを 抽出する能力が上がるほどDの性能は下 がる) 6
Pre-Training Strategy GANはPre-Trainingされたモデルのほうが収束しやすい DSデータセットからP, NG, NDを用意 • Discriminator: simple CNN (P,
ND) ◦ Accuracyが90%を超えるまで学習 • Generator: simple CNN (P, NG) ◦ Pにオーバーフィットさせる 後に、GにFPの確率を徐々に減少させることを学ばせる。 7
DSGAN algorithm 8
Generator LGは離散サンプリングステップを含むため、勾配に基づくアルゴリズムで直接最適化が できない Policy Gradientに基づいて以下の確率を最大化する 9
Discriminator 以下のクロスエントロピー損失関数を最小化する 各エポックの始めにPre-Trainingされたパラメータをロードする 1エポックでDのパフォーマンスが大きく低下 -> robustなG 10
Optimizing Generator Gの品質をより反映するために、2つの角度から報酬rを定義 1. Dでpositiveと判断されるpositive samplesの信頼度を最大化 2. ND上でDの分類精度を下げる(pの最大化) 11
Cleaning Noisy Dataset with Generator • 1つのrelationに対してGeneratorを1つ作成 • GeneratorでDSデータセットを分類 ◦
正例、負例に分割 12
Experiments • Reidel dataset ◦ distant supervision relation extraction dataset
• Freebase ◦ 数十億のtripleを含む知識ベース • New York Times corpus(NYT) • 評価 ◦ 対応するラベル付きデータセットないためHold-Outで評価 13
Training Process of DSGAN NDでDiscriminatorを評価 • 学習が進むにつれ、 Accuracyが下がる 正負の分類精度を評価 •
それぞれの手法でクリーニ ングしたデータで学習 14
Performance Relation Extractionの精度 15
Conclusion • GANによるDistant Supervisionのノイズを除去する方法を提 案 • タスクに依存しないため、あらゆるDistant Supervisionモデル に適用可 •
New York Time datasetで有意な向上が見られた 16