Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150415 文献紹介
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuta
April 15, 2015
Education
240
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20150415 文献紹介
Yuta
April 15, 2015
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
230
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150820 文献紹介
sudo
0
200
20150708 文献紹介
sudo
0
170
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
Other Decks in Education
See All in Education
Throw Yourself In! - How I've learned English and What I'm Facing
georgeorge
1
160
「機械学習と因果推論」入門 ⑤ 因果効果推定の一般化
masakat0
0
130
Lectura 1 (PIT : Python Basico)
robintux
0
370
0506
cbtlibrary
0
200
2026年度春学期 統計学 第4回 データを「分布」で見る (2026. 4. 30)
akiraasano
PRO
0
150
[2026前期火5] 論理学(京都大学文学部 前期 第10回)「論理学の哲学——意味とは何か(Tonkと推論主義)」
yatabe
0
150
AI時代に、 なぜ英語を勉強するのか
empelt
0
120
Examen de Selectividad. Geografía julio 2026 (Convocatoria Extraordinaria). UCLM
juanmartin2026
0
4.2k
生成AIを授業の相棒にするデータサイエンス入門(「デジタル✕探究」イノベーターズフォーラム テクニカルセッション講演資料)
datascientistsociety
PRO
0
310
アラムコSTEAMチャレンジ 実践報告書
codeforeveryone
0
160
勝手にCULTIBASE で広げよう、探究の輪! - CULTIVAL 2026
hiroc_sk
1
230
[2026前期火5] 論理学(京都大学文学部 前期 第1回)「ハルシネーションを外部世界との対応を考えずに見分ける方法」
yatabe
0
1.1k
Featured
See All Featured
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
370
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
750
The Curse of the Amulet
leimatthew05
2
13k
Docker and Python
trallard
47
3.9k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Done Done
chrislema
186
16k
A Soul's Torment
seathinner
6
3k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
220
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
310
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Claude Code のすすめ
schroneko
67
230k
Transcript
文献紹介 自然言語処理研究室 B4 須戸悠太 1
文献情報 • 「日本語文章における表層表現と用例を用いた 動詞の省略の補完」 • 著者:村田 真樹, 長尾 真 •
自然言語処理 Vol. 5 (1998) No. 1 P 119-133 2
概要 • 省略された動詞を表層表現と用例から補完 • 規則の作成 ▫ 省略現象を補完する動詞の有無等で分類 • 小説を対象に実験 ▫
再現率84%、適合率82%の精度で解析 3
はじめに • 省略された動詞を復元 ▫ 対話や機械翻訳システムの実現には不可欠 • 本研究の新しさ ▫ 動詞の省略の補完の研究はほとんどされていない ▫
省略された動詞を推定する ▫ 補完する動詞が文中にない場合、知識を用いて補 う動詞を決定する 4
動詞の省略現象の分類 補完される動詞が テキスト内 同一文 倒置文 前方の文 疑問応答 理由・逆接・仮定 補足 補完される動詞が
テキスト外 疑問文 ダの省略 スルの省略 その他 (常識による補完) 5
テキスト内から補完される省略現象 • 倒置文 ▫ 文末となりうる表現が文の途中にあり、この部分 を中心にして文が倒置される ▫ 「誰ですか、来たのは」 • 疑問応答
▫ 疑問と応答で同一の動詞を使用する際、応答側の 文の動詞が省略される ▫ 「何を壊したの」「これを」 6
テキスト内から補完される省略現象 • 理由・逆接・仮定 ▫ 文末が接続助詞であり、前文と意味関係にあり、 文をまたがった倒置となる ▫ 「明るいね。電気をつけたから」 • 補足
▫ 前文の補足としての役割をする文 ▫ 「物をなくした。鍵を」 7
テキスト外から補完される省略現象 • 疑問文 ▫ 提題助詞「は」で終了している ▫ 「名前は」 • ダの省略 ▫
文が名詞で終了している ▫ 「わたしは学生」 8
テキスト外から補完される省略現象 • スルの省略 ▫ 文末がサ変名詞である ▫ 「コーヒーをお願い」 • その他(常識による補完) ▫
「じつは、ちょっとお願いが……」 ▫ コーパスを利用 意味的に近い表現を抽出し、テキストの次の部分が おおよそ省略部分の内容であると予想 9
照応処理システム • 構文解析・格解析を行う • その結果に対して動詞の省略の補完を行う ▫ 省略の補完の手がかりとなる情報を規則にし、こ れを用いて解の候補に得点を与える ▫ 規則は22個作成し、得点は人手で定めた
10
実験 • 省略の解析を行う前に構文解析・格解析を行う ▫ 解析における誤りのうち、補完に影響を与えるも のについて人手で修正する • 小説「ボッコちゃん」で実験を行う ▫ 学習・テストサンプルの二つに分ける
▫ 規則を学習サンプルを見て作成 11
考察 12 学習サンプル テストサンプル 再現率 適合率 再現率 適合率 全分類 92%
(129/140) 90% (129/144) 84% (125/148) 82% (125/152) テキスト内 100% (57/57) 85% (57/67) 94% (64/68) 81% (64/79) テキスト外 87% (72/83) 94% (72/77) 76% (61/80) 84% (61/73)
考察 • 再現率84%、適合率82%と比較的高い精度が得 られ、作成した規則は有効である • テキスト内補完の精度が良い ▫ テキスト内補完は動詞の場所の特定のみ ▫ テキスト外補完は補完する動詞がテキストにない
事の判定に加え、補完する動詞を知識から持って くる必要がある 13
考察 14 学習サンプル テストサンプル 再現率 適合率 再現率 適合率 倒置 100%(13/13)
93%(13/14) 100%(8/8) 80%(8/10) 疑問応答 100% (3/3) 100%(3/3) -%(0/0) -%(0/0) 理由・逆接・仮定 100%(24/24) 84%(24/27) 100%(33/33) 85%(33/39) 補足 100%(17/17) 74%(17/23) 94%(23/27) 77%(23/30) 疑問文 100%(3/3) 75%(3/4) -%(0/0) 0%(0/3) ダ省略 100%(54/54) 100%(54/54) 100%(51/51) 96%(51/53) スル省略 100%(2/2) 100%(2/2) -%(0/0) -%(0/0) その他(常識の利用) 72%(13/18) 76%(13/17) 56%(10/18) 59%(10/17)
考察 • コーパスを利用して解析する「その他(常識の利 用)」の精度があまり良くなかった ▫ 解析が困難であり、半分程度でも価値がある ▫ コーパスが増加した際に主要な手法となるだろう • 学習サンプルで適合率が100%でないものも
▫ 推定の困難なものや誤判断によって求めるべき省 略の個数を上回った 15
まとめ • 表層表現と用例を用いて動詞を補完する • 再現率84%、適合率82%の精度で解析できた • テキスト内に補完すべき動詞がない場合 ▫ 大規模なコーパスが利用できるようになった際、 提案手法は重要になると考える
16