Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介 8月8日
Search
gumigumi7
August 08, 2016
0
100
文献紹介 8月8日
gumigumi7
August 08, 2016
Tweet
Share
More Decks by gumigumi7
See All by gumigumi7
文献紹介 1月24日
gumigumi7
0
230
文献紹介 11月7日
gumigumi7
0
130
文献紹介 10月3日
gumigumi7
0
320
文献紹介 9月3日
gumigumi7
0
250
文献紹介 8月10日
gumigumi7
0
120
文献紹介 7月16日
gumigumi7
0
260
文献紹介 6月12日
gumigumi7
0
330
文献紹介 5月16日
gumigumi7
0
180
文献紹介 4月18日
gumigumi7
0
140
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
74
8.3k
Mobile First: as difficult as doing things right
swwweet
217
8.6k
Statistics for Hackers
jakevdp
790
220k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
18
7k
Pencils Down: Stop Designing & Start Developing
hursman
117
11k
Designing Experiences People Love
moore
136
23k
For a Future-Friendly Web
brad_frost
172
9k
Build The Right Thing And Hit Your Dates
maggiecrowley
25
2k
Large-scale JavaScript Application Architecture
addyosmani
504
110k
Why You Should Never Use an ORM
jnunemaker
PRO
51
8.7k
Designing for Performance
lara
601
67k
Navigating Team Friction
lara
179
13k
Transcript
文献紹介(2016/05/16) 長岡技術科学大学 B4 桾澤 優希 誤り分析に基づく日本語事実性解析の課題抽出
文献 ▪ 論文 ▪ 成田 和弥, 水野 淳太, 上岡 裕大,
菅野 美和, 乾 健太郎 誤り分析に基づく日本語事実性解析の課題抽出. 自然言語処理, Vol. 22 (2015) No. 5 p. 397-432 ▪ キーワード ▪ 事実性, モダリティ, 機能表現, スコープ 2
概要 ▪ 事実性は,文中の事象の成否について,著者や登場 人物の判断を表す情報 ▪ 機能表現のみを用いたルールベースの事実性解析器を 構築 ▪ 現在の意味ラベルの体系と本研究で用いた単純な規則 だけでも,90%に近い正解率が得られることがわかった.
3
導入 ▪ 膨大なテキストから有益な情報を得るためには事実性と 呼ばれる情報が必要 ▪ 文に記述されている事象が実際におこったのかそうでないのかを判断 するための情報 ▪ 実際に商品を使っているのはa, bのみ
4
導入 ▪ 日本語には事象表現に続く機能表現が多数存在する ▪ 「⟨⟨使わ⟩⟩ない」「⟨⟨使う⟩⟩わけない」「⟨⟨使わ⟩⟩ねぇ」「⟨⟨使う⟩⟩ もんか」 ▪ 文節境界を越えて事象の不成立を示唆する述語の存在 ▪ 「⟨⟨使う⟩⟩のをやめた」
▪ これらが事実性解析の性能向上を阻害している。 ▪ 事実性解析の課題分析を行うため実際に機能表現のみ を用いたルールベースの事実性解析器を構築 5
理論 ▪ 事実性解析に関わる言語要素 ▪ 事象に含まれる機能表現 ▪ 疑問詞を含む副詞 ▪ 文節境界を超えて事実性に影響を与える語とそのスコープ ▪
その他 6
理論 7 ▪ 機能表現 ▪ 多義性の問題 ▪ 表現の多様性 ▪ これらに加えて複数の表現の組み合わせも存在する。
理論 8
理論 9 ▪ 以下のラベルに沿って分類
理論 10 ▪ 機能表現の意味ラベルを用いた解析モデル ▪ 各事象表現よりも後ろにある機能表現の意味ラベルを利用する ▪ 機能表現の意味ラベルが⟨否定⟩⟨否定意志⟩⟨否定推量⟩⟨無意味⟩⟨不明 確⟩⟨不可能⟩⟨回避⟩⟨不必要⟩⟨放置⟩⟨困難⟩のいずれかの場合,肯否極 性を反転
▪ 機能表現の意味ラベルが⟨推量-不確実⟩⟨推量-高確実性⟩⟨否定推量⟩⟨ 意志⟩⟨否定意志⟩ ⟨伝聞⟩⟨様態⟩⟨容易⟩⟨困難⟩のいずれかの場合,確信 度を下げる ▪ 機能表現の意味ラベルが⟨疑問⟩⟨勧誘⟩⟨勧め⟩⟨願望⟩⟨依頼⟩のいずれかの 場合,事実性をUuにする
実験 ▪ 拡張モダリティタグ付与コーパスに含まれる6,362文のうち 1,533文を選択し課題分析の対象とする ▪ 含まれる3,734個の事象に意味ラベルを付与 ▪ 先ほど構築したルールベースによる事実性解析モデルと、 既存の素性を組み込んだモダリティ解析器Zundaと比較 11
結果 12
結果 13
実験 14 ▪ 副詞の影響を加味する必要がある事例も半分近くある
まとめ ▪ 機能表 現のみを用いたルールベースの事実性解析器を 構築し,1,533文に含まれる3,734事象に適用した結果 の誤りを分析した ▪ 機能表現の意味ラベルが正しく解析できれば,単純な規 則だけでも,90%に近い正解率が得られることがわかった ▪
機能表現解析の問題を除けば副詞に起因する誤りを 研究することで正確な解析が行える 15
理論 16 ▪ 述語周辺の副詞 ▪ 事実性に影響をおよぼす ▪ 文節境界を越えて事実性に影響を与える語とスコープ ▪ 事象表現より後続の語によって事実性が決定される