Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:共変量シフトの問題としての語義曖昧性解消の領域適応
Search
Atom
March 25, 2019
0
110
文献紹介:共変量シフトの問題としての 語義曖昧性解消の領域適応
Atom
March 25, 2019
Tweet
Share
More Decks by Atom
See All by Atom
文献紹介 / Structure-based Knowledge Tracing: An Influence Propagation View
roraidolaurent
0
76
文献紹介 / Knowledge Tracing with GNN
roraidolaurent
0
76
文献紹介 / Non-Intrusive Parametric Reduced Order Models withHigh-Dimensional Inputs via Gradient-Free Active Subspace
roraidolaurent
0
45
ニューラルネットワークのベイズ推論 / Bayesian inference of neural networks
roraidolaurent
1
2.7k
Graph Convolutional Networks
roraidolaurent
0
200
文献紹介 / A Probabilistic Annotation Model for Crowdsourcing Coreference
roraidolaurent
0
54
文献紹介Deep Temporal-Recurrent-Replicated-Softmax for Topical Trends over Time
roraidolaurent
0
86
文献紹介/ Bayesian Learning for Neural Dependency Parsing
roraidolaurent
0
90
ポッキー数列の加法定理 / Pocky number additon theorem
roraidolaurent
0
190
Featured
See All Featured
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.2k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.3k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Writing Fast Ruby
sferik
628
61k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Reflections from 52 weeks, 52 projects
jeffersonlam
347
20k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Practical Orchestrator
shlominoach
186
10k
Speed Design
sergeychernyshev
25
670
Git: the NoSQL Database
bkeepers
PRO
427
64k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Transcript
共変量シフトの問題としての 語義曖昧性解消の領域適応 新納 浩幸, 佐々木 稔 文献紹介 2019/3/25 長岡技術科学大学 自然言語処理研究室
吉澤 亜斗武 自然言語処理 Vol.21 No.1 p.61-79, 2014
1. 概要 ・語義曖昧性解消(Word Sense Disambiguation, WSD)の 領域適応が共変量シフトの問題と見なせることを示し, 共変量シフトの解法である確率密度比を重みにした パラメータ学習によりWSDの領域適応の解決を図った. ・提案手法はDaumeの手法と同等以上の正解率を出した.
・教師なし領域適応への応用が期待 (自然言語処理 Vol.21 No.5 ,2014) 2
2. はじめに ・WSDとは文 内の多義語 の語義 ∈ を推定する問題 ・領域適応問題とは,コーパス (ソース領域)から学習された 分類器では,コーパス
(ターゲット領域)のデータを 精度よく解析することができない. ・ベースライン:Daumeの手法 「素性空間拡張法(Feature Augmentation)」により 拡張されたデータを用いてSVMなどで識別を行う. 3
2. はじめに_素性空間拡張法 ・素性空間拡張法 ソース領域の訓練データのベクトル を = , , 0 とし,
ターゲット領域の訓練データのベクトル を = 0, , とする. こうすることで,共通する特徴は重みづけされやすくなる. 4
2. はじめに_共変量シフトの問題 ・提案手法 素性空間拡張法により拡張されたデータを用いてWSDの 領域適応問題を共変量シフトの問題として捉える = () ≠ () ∴
= , , = = 5
3. 理論_期待損失最小化(途中まで) 0 = � , (, , ) ,
= � , (, , ) , , , = � , (, , ) , ≈ 1 � =1 ( , , ) 6
3. 理論_提案手法の数式化 7
2. 理論_確率密度比の算出 ・ , ()を求める際にはNaïve Bayes のモデルを用いる. 用例の素性リスト{1 , 2
, ⋯ }を作成しておく. = � =1 = , + 1 + 2 8
4. 実験 ・BCCWJコーパスのPB(書籍),OC(Yahoo!知恵袋)及び PN(新聞)を異なった領域として実験を行う. ・SemEval-2の日本語WSDタスクの上記の領域のコーパスの 一部に語義タグを付けたデータを利用 ・ある程度の頻度のある多義語16単語をWSDの対象単語とする. ・8種類の素性を利用(単語の品詞,表記など) 9
4. 実験 10
4. 実験_評価方法 11
4. 実験結果 12
4. 考察 13 負の転移:ソース領域とターゲット領域間の距離が離れすぎると, ソース領域の知識を使いすぎによる分類器の精度が悪化が生じる
5. まとめ 14 ・本研究では素性空間拡張法により拡張されたデータに対して 共変量シフトの解法を行うことにより,WSDの領域適応の 解決が図れることを示した. ・BCCWJコーパスの3つの領域における16単語を対象に実験を 行い,Daumeの手法と同等以上の正答率を出した. ・教師なし領域適応への応用をしていきたい.