Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:共変量シフトの問題としての語義曖昧性解消の領域適応
Search
Atom
March 25, 2019
0
120
文献紹介:共変量シフトの問題としての 語義曖昧性解消の領域適応
Atom
March 25, 2019
Tweet
Share
More Decks by Atom
See All by Atom
文献紹介 / Structure-based Knowledge Tracing: An Influence Propagation View
roraidolaurent
0
88
文献紹介 / Knowledge Tracing with GNN
roraidolaurent
0
92
文献紹介 / Non-Intrusive Parametric Reduced Order Models withHigh-Dimensional Inputs via Gradient-Free Active Subspace
roraidolaurent
0
55
ニューラルネットワークのベイズ推論 / Bayesian inference of neural networks
roraidolaurent
1
2.8k
Graph Convolutional Networks
roraidolaurent
0
230
文献紹介 / A Probabilistic Annotation Model for Crowdsourcing Coreference
roraidolaurent
0
65
文献紹介Deep Temporal-Recurrent-Replicated-Softmax for Topical Trends over Time
roraidolaurent
0
96
文献紹介/ Bayesian Learning for Neural Dependency Parsing
roraidolaurent
0
120
ポッキー数列の加法定理 / Pocky number additon theorem
roraidolaurent
0
210
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
281
13k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.5k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
How to train your dragon (web standard)
notwaldorf
94
6.1k
Documentation Writing (for coders)
carmenintech
72
4.9k
A Modern Web Designer's Workflow
chriscoyier
694
190k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Being A Developer After 40
akosma
90
590k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.3k
Speed Design
sergeychernyshev
32
1k
GraphQLとの向き合い方2022年版
quramy
49
14k
Transcript
共変量シフトの問題としての 語義曖昧性解消の領域適応 新納 浩幸, 佐々木 稔 文献紹介 2019/3/25 長岡技術科学大学 自然言語処理研究室
吉澤 亜斗武 自然言語処理 Vol.21 No.1 p.61-79, 2014
1. 概要 ・語義曖昧性解消(Word Sense Disambiguation, WSD)の 領域適応が共変量シフトの問題と見なせることを示し, 共変量シフトの解法である確率密度比を重みにした パラメータ学習によりWSDの領域適応の解決を図った. ・提案手法はDaumeの手法と同等以上の正解率を出した.
・教師なし領域適応への応用が期待 (自然言語処理 Vol.21 No.5 ,2014) 2
2. はじめに ・WSDとは文 内の多義語 の語義 ∈ を推定する問題 ・領域適応問題とは,コーパス (ソース領域)から学習された 分類器では,コーパス
(ターゲット領域)のデータを 精度よく解析することができない. ・ベースライン:Daumeの手法 「素性空間拡張法(Feature Augmentation)」により 拡張されたデータを用いてSVMなどで識別を行う. 3
2. はじめに_素性空間拡張法 ・素性空間拡張法 ソース領域の訓練データのベクトル を = , , 0 とし,
ターゲット領域の訓練データのベクトル を = 0, , とする. こうすることで,共通する特徴は重みづけされやすくなる. 4
2. はじめに_共変量シフトの問題 ・提案手法 素性空間拡張法により拡張されたデータを用いてWSDの 領域適応問題を共変量シフトの問題として捉える = () ≠ () ∴
= , , = = 5
3. 理論_期待損失最小化(途中まで) 0 = � , (, , ) ,
= � , (, , ) , , , = � , (, , ) , ≈ 1 � =1 ( , , ) 6
3. 理論_提案手法の数式化 7
2. 理論_確率密度比の算出 ・ , ()を求める際にはNaïve Bayes のモデルを用いる. 用例の素性リスト{1 , 2
, ⋯ }を作成しておく. = � =1 = , + 1 + 2 8
4. 実験 ・BCCWJコーパスのPB(書籍),OC(Yahoo!知恵袋)及び PN(新聞)を異なった領域として実験を行う. ・SemEval-2の日本語WSDタスクの上記の領域のコーパスの 一部に語義タグを付けたデータを利用 ・ある程度の頻度のある多義語16単語をWSDの対象単語とする. ・8種類の素性を利用(単語の品詞,表記など) 9
4. 実験 10
4. 実験_評価方法 11
4. 実験結果 12
4. 考察 13 負の転移:ソース領域とターゲット領域間の距離が離れすぎると, ソース領域の知識を使いすぎによる分類器の精度が悪化が生じる
5. まとめ 14 ・本研究では素性空間拡張法により拡張されたデータに対して 共変量シフトの解法を行うことにより,WSDの領域適応の 解決が図れることを示した. ・BCCWJコーパスの3つの領域における16単語を対象に実験を 行い,Daumeの手法と同等以上の正答率を出した. ・教師なし領域適応への応用をしていきたい.