Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Web 情報からの罹患検出を対象とした事実性解析・主体解析の誤り分析
Search
katsutan
March 23, 2017
Technology
0
110
Web 情報からの罹患検出を対象とした事実性解析・主体解析の誤り分析
文献紹介
長岡技術科学大学 自然言語処理研究室
勝田哲弘
katsutan
March 23, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
180
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
160
Simple task-specific bilingual word embeddings
katsutan
0
180
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
210
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
160
Improving Word Embeddings Using Kernel PCA
katsutan
0
180
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
250
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
230
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
250
Other Decks in Technology
See All in Technology
エンジニア人生の拡張性を高める 「探索型キャリア設計」の提案
tenshoku_draft
1
130
Flutterによる 効率的なAndroid・iOS・Webアプリケーション開発の事例
recruitengineers
PRO
0
120
Platform Engineering for Software Developers and Architects
syntasso
1
520
OTelCol_TailSampling_and_SpanMetrics
gumamon
1
190
SREが投資するAIOps ~ペアーズにおけるLLM for Developerへの取り組み~
takumiogawa
1
420
これまでの計測・開発・デプロイ方法全部見せます! / Findy ISUCON 2024-11-14
tohutohu
3
370
OS 標準のデザインシステムを超えて - より柔軟な Flutter テーマ管理 | FlutterKaigi 2024
ronnnnn
0
200
障害対応指揮の意思決定と情報共有における価値観 / Waroom Meetup #2
arthur1
5
480
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
130
CysharpのOSS群から見るModern C#の現在地
neuecc
2
3.5k
SSMRunbook作成の勘所_20241120
koichiotomo
3
160
日経電子版のStoreKit2フルリニューアル
shimastripe
1
140
Featured
See All Featured
Code Review Best Practice
trishagee
64
17k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
131
33k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
6.9k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
RailsConf 2023
tenderlove
29
900
Optimizing for Happiness
mojombo
376
70k
KATA
mclloyd
29
14k
Optimising Largest Contentful Paint
csswizardry
33
2.9k
Faster Mobile Websites
deanohume
305
30k
Building Better People: How to give real-time feedback that sticks.
wjessup
364
19k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
126
18k
Transcript
文献紹介: Web 情報からの罹患検出を対象とした 事実性解析・主体解析の誤り分析 叶内 晨, 北川 善彬, 荒牧 英治,岡崎
直観, 小町 守 自然言語処理 Vol. 22 (2015) No. 5 p.363-395 長岡技術科学大学 自然言語処理研究室 学部3年 勝田哲弘 図、表などは論文中から引用しています。 1 2017/3/24
概要 • NLPによるソーシャルリスニングの問題点 ▫ ツイートからインフルエンザや風邪などの疾患・ 症状を認識 • 正例と負例の分類は事実性解析と主体解析をう まく組み合わせると精度を向上させることがで きることが分かった。
2
コーパス • 2008年から2010年にかけてTwitter API を用いて30億発言を収集 • 「インフルエンザ」や「風邪」といったキー ワードを含む発言を抽出 3
コーパス • 負例の判断 ▫ 居住地が正確でない発言 ▫ 24時間以内の疾患についての発言でない ▫ 否定の表現、疑問や不確かな発言 4
コーパス • インフルエンザの具体例 5
分類器の誤り分析 • SVMにて構築し、その誤りを人手で分類 6
分類器の誤り分析 • 事実性(時制、モダリティ、否定) • 主体性(非当事者、一般論) • 比喩 7
事実性解析 事実をもつかもたないかの2値分類 • つつじによる素性 ▫ 同じような意味の機能表現をまとめた • Zundaによる素性 ▫ 仮想性の解析
8
インフルエンザ感染の2値分類 • 評価 ▫ 5分割交差検定 ▫ 適合率、再現率、F1-スコア • ツール ▫
Classias(ver.1.1) ▫ MeCab(ver.0.996)、IPA-Dic(ver.2.7.0) 9
インフルエンザ感染の2値分類 • インフルエンザを中心に前後3つの形態素を Bag of Words(BoW)の素性とし、モダリティ以 外の素性を加えたものをベースラインの分類器 として作成 10
インフルエンザ感染の2値分類 • 結果 11
主体解析 • 疾患・症状毎に500件、合計3000件に誰 が主体になっているかのラベル付けをした 12
主体解析 • ラベルの種類 13
主体解析 • 正負の割合(対象が複数の場合は除く) • 主体が認識できれば 14
主体ラベル推定器 • 「風邪」や「頭痛」などの疾患・症状を保有し ている主体ラベルを推定する • 「物体」「主体なし」については主たる対象で はないので統合する • 分類器にClassias 1.1を使い、L2正則化ロジス
ティック回帰モデルを学習 15
主体ラベル推定器 16
主体ラベル推定器 • 精度 5分割交差検定 17
主体ラベル推定器 18
罹患検出 • 推定した主体ラベル、付与した正解の主体ラベ ルを素性として用いた結果 19
事実性解析と主体解析 • 主体ラベルを推定するときはそれぞれの発言を ランダムに500件抽出し正解ラベルを付与し 学習 • 5分割交差検定 20
事実性解析と主体解析 • 事実性解析はインフルエンザにおいて大幅に上 昇した ▫ 返信先が疾患に罹っている場合や比喩的な問題が あるため風邪では精度が上がらなかった • 事実性と主体を組み合わせると主体問題が多少 解決するため全体的に向上した
21
まとめ • 事実性の解析、状態を保有する主体の判定が罹 患検出に貢献する • 実験によって実際に制度が向上していることを 確認した 22