Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Web 情報からの罹患検出を対象とした事実性解析・主体解析の誤り分析
Search
katsutan
March 23, 2017
Technology
120
0
Share
Web 情報からの罹患検出を対象とした事実性解析・主体解析の誤り分析
文献紹介
長岡技術科学大学 自然言語処理研究室
勝田哲弘
katsutan
March 23, 2017
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
240
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
220
Simple task-specific bilingual word embeddings
katsutan
0
220
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
270
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
220
Improving Word Embeddings Using Kernel PCA
katsutan
0
230
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
330
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
280
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
300
Other Decks in Technology
See All in Technology
AIペネトレーションテスト・ セキュリティ検証「AgenticSec」ご紹介資料
laysakura
0
4k
20年前の「OSS革命」に学ぶ AI時代の生存戦略
samakada
0
310
Introduction to Bill One Development Engineer
sansan33
PRO
0
410
AWS Agent Registry の基礎・概要を理解する/aws-agent-registry-intro
ren8k
2
350
扱える不確実性を増やしていく - スタートアップEMが考える「任せ方」
kadoppe
0
280
実践ハーネスエンジニアリング:TAKTで実現するAIエージェント制御 / Practical Harness Engineering: AI Agent Control Enabled by TAKT
nrslib
9
4.1k
Data Hubグループ 紹介資料
sansan33
PRO
0
2.9k
最新の脅威動向から考える、コンテナサプライチェーンのリスクと対策
kyohmizu
1
680
Introduction to Sansan Meishi Maker Development Engineer
sansan33
PRO
0
390
ぼくがかんがえたさいきょうのあうとぷっと
yama3133
0
180
"SQLは書けません"から始まる データドリブン
kubell_hr
2
470
[OpsJAWS 40]リリースしたら終わり、じゃなかった。セキュリティ空白期間をAWS Security Agentで埋める
sh_fk2
3
220
Featured
See All Featured
What's in a price? How to price your products and services
michaelherold
247
13k
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
470
The Limits of Empathy - UXLibs8
cassininazir
1
300
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
The Pragmatic Product Professional
lauravandoore
37
7.2k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
270
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Between Models and Reality
mayunak
3
260
The SEO Collaboration Effect
kristinabergwall1
0
420
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
190
BBQ
matthewcrist
89
10k
Transcript
文献紹介: Web 情報からの罹患検出を対象とした 事実性解析・主体解析の誤り分析 叶内 晨, 北川 善彬, 荒牧 英治,岡崎
直観, 小町 守 自然言語処理 Vol. 22 (2015) No. 5 p.363-395 長岡技術科学大学 自然言語処理研究室 学部3年 勝田哲弘 図、表などは論文中から引用しています。 1 2017/3/24
概要 • NLPによるソーシャルリスニングの問題点 ▫ ツイートからインフルエンザや風邪などの疾患・ 症状を認識 • 正例と負例の分類は事実性解析と主体解析をう まく組み合わせると精度を向上させることがで きることが分かった。
2
コーパス • 2008年から2010年にかけてTwitter API を用いて30億発言を収集 • 「インフルエンザ」や「風邪」といったキー ワードを含む発言を抽出 3
コーパス • 負例の判断 ▫ 居住地が正確でない発言 ▫ 24時間以内の疾患についての発言でない ▫ 否定の表現、疑問や不確かな発言 4
コーパス • インフルエンザの具体例 5
分類器の誤り分析 • SVMにて構築し、その誤りを人手で分類 6
分類器の誤り分析 • 事実性(時制、モダリティ、否定) • 主体性(非当事者、一般論) • 比喩 7
事実性解析 事実をもつかもたないかの2値分類 • つつじによる素性 ▫ 同じような意味の機能表現をまとめた • Zundaによる素性 ▫ 仮想性の解析
8
インフルエンザ感染の2値分類 • 評価 ▫ 5分割交差検定 ▫ 適合率、再現率、F1-スコア • ツール ▫
Classias(ver.1.1) ▫ MeCab(ver.0.996)、IPA-Dic(ver.2.7.0) 9
インフルエンザ感染の2値分類 • インフルエンザを中心に前後3つの形態素を Bag of Words(BoW)の素性とし、モダリティ以 外の素性を加えたものをベースラインの分類器 として作成 10
インフルエンザ感染の2値分類 • 結果 11
主体解析 • 疾患・症状毎に500件、合計3000件に誰 が主体になっているかのラベル付けをした 12
主体解析 • ラベルの種類 13
主体解析 • 正負の割合(対象が複数の場合は除く) • 主体が認識できれば 14
主体ラベル推定器 • 「風邪」や「頭痛」などの疾患・症状を保有し ている主体ラベルを推定する • 「物体」「主体なし」については主たる対象で はないので統合する • 分類器にClassias 1.1を使い、L2正則化ロジス
ティック回帰モデルを学習 15
主体ラベル推定器 16
主体ラベル推定器 • 精度 5分割交差検定 17
主体ラベル推定器 18
罹患検出 • 推定した主体ラベル、付与した正解の主体ラベ ルを素性として用いた結果 19
事実性解析と主体解析 • 主体ラベルを推定するときはそれぞれの発言を ランダムに500件抽出し正解ラベルを付与し 学習 • 5分割交差検定 20
事実性解析と主体解析 • 事実性解析はインフルエンザにおいて大幅に上 昇した ▫ 返信先が疾患に罹っている場合や比喩的な問題が あるため風邪では精度が上がらなかった • 事実性と主体を組み合わせると主体問題が多少 解決するため全体的に向上した
21
まとめ • 事実性の解析、状態を保有する主体の判定が罹 患検出に貢献する • 実験によって実際に制度が向上していることを 確認した 22