Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:共変量シフトの問題としての語義曖昧性解消の領域適応
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Atom
March 25, 2019
0
120
文献紹介:共変量シフトの問題としての 語義曖昧性解消の領域適応
Atom
March 25, 2019
Tweet
Share
More Decks by Atom
See All by Atom
文献紹介 / Structure-based Knowledge Tracing: An Influence Propagation View
roraidolaurent
0
100
文献紹介 / Knowledge Tracing with GNN
roraidolaurent
0
100
文献紹介 / Non-Intrusive Parametric Reduced Order Models withHigh-Dimensional Inputs via Gradient-Free Active Subspace
roraidolaurent
0
60
ニューラルネットワークのベイズ推論 / Bayesian inference of neural networks
roraidolaurent
2
2.8k
Graph Convolutional Networks
roraidolaurent
0
240
文献紹介 / A Probabilistic Annotation Model for Crowdsourcing Coreference
roraidolaurent
0
78
文献紹介Deep Temporal-Recurrent-Replicated-Softmax for Topical Trends over Time
roraidolaurent
0
120
文献紹介/ Bayesian Learning for Neural Dependency Parsing
roraidolaurent
0
130
ポッキー数列の加法定理 / Pocky number additon theorem
roraidolaurent
0
240
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
First, design no harm
axbom
PRO
2
1.1k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
77
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
97
Paper Plane (Part 1)
katiecoart
PRO
0
4.3k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
70
Skip the Path - Find Your Career Trail
mkilby
0
60
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
110
Building the Perfect Custom Keyboard
takai
2
690
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
57
Transcript
共変量シフトの問題としての 語義曖昧性解消の領域適応 新納 浩幸, 佐々木 稔 文献紹介 2019/3/25 長岡技術科学大学 自然言語処理研究室
吉澤 亜斗武 自然言語処理 Vol.21 No.1 p.61-79, 2014
1. 概要 ・語義曖昧性解消(Word Sense Disambiguation, WSD)の 領域適応が共変量シフトの問題と見なせることを示し, 共変量シフトの解法である確率密度比を重みにした パラメータ学習によりWSDの領域適応の解決を図った. ・提案手法はDaumeの手法と同等以上の正解率を出した.
・教師なし領域適応への応用が期待 (自然言語処理 Vol.21 No.5 ,2014) 2
2. はじめに ・WSDとは文 内の多義語 の語義 ∈ を推定する問題 ・領域適応問題とは,コーパス (ソース領域)から学習された 分類器では,コーパス
(ターゲット領域)のデータを 精度よく解析することができない. ・ベースライン:Daumeの手法 「素性空間拡張法(Feature Augmentation)」により 拡張されたデータを用いてSVMなどで識別を行う. 3
2. はじめに_素性空間拡張法 ・素性空間拡張法 ソース領域の訓練データのベクトル を = , , 0 とし,
ターゲット領域の訓練データのベクトル を = 0, , とする. こうすることで,共通する特徴は重みづけされやすくなる. 4
2. はじめに_共変量シフトの問題 ・提案手法 素性空間拡張法により拡張されたデータを用いてWSDの 領域適応問題を共変量シフトの問題として捉える = () ≠ () ∴
= , , = = 5
3. 理論_期待損失最小化(途中まで) 0 = � , (, , ) ,
= � , (, , ) , , , = � , (, , ) , ≈ 1 � =1 ( , , ) 6
3. 理論_提案手法の数式化 7
2. 理論_確率密度比の算出 ・ , ()を求める際にはNaïve Bayes のモデルを用いる. 用例の素性リスト{1 , 2
, ⋯ }を作成しておく. = � =1 = , + 1 + 2 8
4. 実験 ・BCCWJコーパスのPB(書籍),OC(Yahoo!知恵袋)及び PN(新聞)を異なった領域として実験を行う. ・SemEval-2の日本語WSDタスクの上記の領域のコーパスの 一部に語義タグを付けたデータを利用 ・ある程度の頻度のある多義語16単語をWSDの対象単語とする. ・8種類の素性を利用(単語の品詞,表記など) 9
4. 実験 10
4. 実験_評価方法 11
4. 実験結果 12
4. 考察 13 負の転移:ソース領域とターゲット領域間の距離が離れすぎると, ソース領域の知識を使いすぎによる分類器の精度が悪化が生じる
5. まとめ 14 ・本研究では素性空間拡張法により拡張されたデータに対して 共変量シフトの解法を行うことにより,WSDの領域適応の 解決が図れることを示した. ・BCCWJコーパスの3つの領域における16単語を対象に実験を 行い,Daumeの手法と同等以上の正答率を出した. ・教師なし領域適応への応用をしていきたい.