Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150415 文献紹介
Search
Yuta
April 15, 2015
Education
240
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20150415 文献紹介
Yuta
April 15, 2015
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
230
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150820 文献紹介
sudo
0
200
20150708 文献紹介
sudo
0
170
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
Other Decks in Education
See All in Education
2026年度春学期 統計学 第3回 クロス集計と感度・特異度,データの可視化 (2026. 4. 23)
akiraasano
PRO
0
160
SARA Annual Report 2025-26
sara2023
1
380
0513
cbtlibrary
0
200
輻射安全管理系統2.0暨輻防e++學園平台說明會
aecrp
0
1k
2026年度春学期 統計学 第2回 統計資料の収集と読み方 (2026. 4. 16)
akiraasano
PRO
0
200
Stardy 会社紹介資料
stardy
0
1.6k
コミュニティを通じた_キャリア設計のススメ_20260424.pdf
masakiokuda
0
330
[2026前期火5] 論理学(京都大学文学部 前期 第3回)「形式言語と四つのキーワード:メタ・構成・意味論・ハーモニー」
yatabe
0
570
Catecismo 26 #1 - Aula inaugural
cm_manaus
0
180
Examen de Selectividad. Geografía julio 2026 (Convocatoria Extraordinaria). UCLM
juanmartin2026
0
4.2k
教育現場から見た Ruby on Rails
yasslab
PRO
0
180
プロポーザルを書く技術とアンチパターン/proposal-writing-and-antipatterns
moriyuya
13
3.5k
Featured
See All Featured
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
190
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Un-Boring Meetings
codingconduct
0
330
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
200
Git: the NoSQL Database
bkeepers
PRO
432
67k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
170
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Transcript
文献紹介 自然言語処理研究室 B4 須戸悠太 1
文献情報 • 「日本語文章における表層表現と用例を用いた 動詞の省略の補完」 • 著者:村田 真樹, 長尾 真 •
自然言語処理 Vol. 5 (1998) No. 1 P 119-133 2
概要 • 省略された動詞を表層表現と用例から補完 • 規則の作成 ▫ 省略現象を補完する動詞の有無等で分類 • 小説を対象に実験 ▫
再現率84%、適合率82%の精度で解析 3
はじめに • 省略された動詞を復元 ▫ 対話や機械翻訳システムの実現には不可欠 • 本研究の新しさ ▫ 動詞の省略の補完の研究はほとんどされていない ▫
省略された動詞を推定する ▫ 補完する動詞が文中にない場合、知識を用いて補 う動詞を決定する 4
動詞の省略現象の分類 補完される動詞が テキスト内 同一文 倒置文 前方の文 疑問応答 理由・逆接・仮定 補足 補完される動詞が
テキスト外 疑問文 ダの省略 スルの省略 その他 (常識による補完) 5
テキスト内から補完される省略現象 • 倒置文 ▫ 文末となりうる表現が文の途中にあり、この部分 を中心にして文が倒置される ▫ 「誰ですか、来たのは」 • 疑問応答
▫ 疑問と応答で同一の動詞を使用する際、応答側の 文の動詞が省略される ▫ 「何を壊したの」「これを」 6
テキスト内から補完される省略現象 • 理由・逆接・仮定 ▫ 文末が接続助詞であり、前文と意味関係にあり、 文をまたがった倒置となる ▫ 「明るいね。電気をつけたから」 • 補足
▫ 前文の補足としての役割をする文 ▫ 「物をなくした。鍵を」 7
テキスト外から補完される省略現象 • 疑問文 ▫ 提題助詞「は」で終了している ▫ 「名前は」 • ダの省略 ▫
文が名詞で終了している ▫ 「わたしは学生」 8
テキスト外から補完される省略現象 • スルの省略 ▫ 文末がサ変名詞である ▫ 「コーヒーをお願い」 • その他(常識による補完) ▫
「じつは、ちょっとお願いが……」 ▫ コーパスを利用 意味的に近い表現を抽出し、テキストの次の部分が おおよそ省略部分の内容であると予想 9
照応処理システム • 構文解析・格解析を行う • その結果に対して動詞の省略の補完を行う ▫ 省略の補完の手がかりとなる情報を規則にし、こ れを用いて解の候補に得点を与える ▫ 規則は22個作成し、得点は人手で定めた
10
実験 • 省略の解析を行う前に構文解析・格解析を行う ▫ 解析における誤りのうち、補完に影響を与えるも のについて人手で修正する • 小説「ボッコちゃん」で実験を行う ▫ 学習・テストサンプルの二つに分ける
▫ 規則を学習サンプルを見て作成 11
考察 12 学習サンプル テストサンプル 再現率 適合率 再現率 適合率 全分類 92%
(129/140) 90% (129/144) 84% (125/148) 82% (125/152) テキスト内 100% (57/57) 85% (57/67) 94% (64/68) 81% (64/79) テキスト外 87% (72/83) 94% (72/77) 76% (61/80) 84% (61/73)
考察 • 再現率84%、適合率82%と比較的高い精度が得 られ、作成した規則は有効である • テキスト内補完の精度が良い ▫ テキスト内補完は動詞の場所の特定のみ ▫ テキスト外補完は補完する動詞がテキストにない
事の判定に加え、補完する動詞を知識から持って くる必要がある 13
考察 14 学習サンプル テストサンプル 再現率 適合率 再現率 適合率 倒置 100%(13/13)
93%(13/14) 100%(8/8) 80%(8/10) 疑問応答 100% (3/3) 100%(3/3) -%(0/0) -%(0/0) 理由・逆接・仮定 100%(24/24) 84%(24/27) 100%(33/33) 85%(33/39) 補足 100%(17/17) 74%(17/23) 94%(23/27) 77%(23/30) 疑問文 100%(3/3) 75%(3/4) -%(0/0) 0%(0/3) ダ省略 100%(54/54) 100%(54/54) 100%(51/51) 96%(51/53) スル省略 100%(2/2) 100%(2/2) -%(0/0) -%(0/0) その他(常識の利用) 72%(13/18) 76%(13/17) 56%(10/18) 59%(10/17)
考察 • コーパスを利用して解析する「その他(常識の利 用)」の精度があまり良くなかった ▫ 解析が困難であり、半分程度でも価値がある ▫ コーパスが増加した際に主要な手法となるだろう • 学習サンプルで適合率が100%でないものも
▫ 推定の困難なものや誤判断によって求めるべき省 略の個数を上回った 15
まとめ • 表層表現と用例を用いて動詞を補完する • 再現率84%、適合率82%の精度で解析できた • テキスト内に補完すべき動詞がない場合 ▫ 大規模なコーパスが利用できるようになった際、 提案手法は重要になると考える
16