Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
構造解析について
Search
masaya82
January 16, 2018
0
260
構造解析について
masaya82
January 16, 2018
Tweet
Share
More Decks by masaya82
See All by masaya82
文献紹介 : More is not always better: balancing sense distributions for all-words
masaya82
0
110
文献紹介:Enhancing Modern Supervised Word Sense Disambiguation Models
masaya82
0
130
文献紹介:The Word Sense Disambiguation Test Suite at WMT18
masaya82
0
71
文献紹介:Preposition Sense Disambiguation and Representation
masaya82
0
98
文献紹介:Word Sense Disambiguation Based on Word Similarity Calculation Using Word Vector Representation from a Knowledge-based Graph
masaya82
0
120
Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation
masaya82
0
81
Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
masaya82
0
96
Improving Word Sense Disambiguation in Neural Machine Translation with Sense Embeddings
masaya82
0
110
Learning_to_Identify_the_Best_Contexts_for_Knowledge-based_WSD
masaya82
0
100
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
51
7.3k
Site-Speed That Sticks
csswizardry
1
170
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
17
2.2k
The Invisible Side of Design
smashingmag
298
50k
Done Done
chrislema
181
16k
Designing on Purpose - Digital PM Summit 2013
jponch
116
7k
Optimizing for Happiness
mojombo
376
70k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.9k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
111
49k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Transcript
構造解析について 自然言語処理研究室 B3 福嶋 真也
参考文献 • 「自然言語処理の基本と技術」 2章 著者 奥野 陽、グラム・ニュービッグ、萩原 正人 • 株式会社
翔泳社 発行
文の構造の曖昧性 例:白い表紙の新しい本 日本語での解釈 1.新しい本があって、その本の表紙が白い 2.白い本があって、その本の表紙が新しい 3.本があって、その本の表紙が新しくて白い 英訳 1.the new book
with the white cover 2.the white book with the new cover 3.the book with the white new cover
係り受け構造 文中の単語の関係性を矢印で表示 例: 1.白い 表紙 の 新しい 本 2.白い 表紙
の 新しい 本 3.白い 表紙 の 新しい 本 1.新しい本があって、その本の表紙が白い 2.白い本があって、その本の表紙が新しい 3.本があって、その本の表紙が新しくて白い
係り受け構造 用語 ・親(主辞)・・・矢印のさす単語 ・子(従属語)・・・矢印が出ている単語 日本語における係り受け構造の特徴 ・ふつう親は子より右側に位置する the new book with
the white cover つまり機械的に左から右へ解析を行うことが可能 英語
係り受け解析 自動的に係り受け構造を文に付与する技術 ・Shift-Reduce法 Shift・・・未処理単語列から、最初の単語を木の集合に移動さ せる Reduce・・・木の集合の内、右から2番目の木から、右から1番 の木へ矢印を引く 機械学習に基づいてこれらの操作を選択、実行して解析を行う
係り受け解析 例: 白い 表紙 の 新しい 本 白い 表紙 の
新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 shift reduce shift shift shift shift reduce reduce reduce
係り受け解析 英語のような後ろから修飾ができるような言語でも使用可能 →その場合reduceの操作に操作の方向を指定するright、left が必要に(reduce-right、reduce-left) Shift-Reduce法のメリット ・解析速度 デメリット ・精度
係り受け解析 ・MST(Minimum Spaning Tree)法 文全体の係り受けを同時に解析 文中の単語の組から機械学習に基づいて係り受けが存在する 確率を計算し、グラフ構造に表す。これから最適な木を探す メリット ・ Shift-Reduce法より多少精度がよい
デメリット ・処理時間がかかる
係り受け解析 例: 文)白い 表紙 の 新しい 本 グラフ) 木) 白い
表紙 の 本 新しい 白い 表紙 の 本 新しい スコア付け 木の探索
句構造解析 係り受け解析と同じく、文の構造を知る手法 句に注目して解析 主に語順が決まっている言語に対して使用 主な句 ・動詞句 ・名詞句 ・形容詞句 ・名詞句 ・助詞句
句構造解析 例:白い表紙の新しい本 (新しい本があって、その本の表紙が白い) NP PP NP ADJ N P ADJ
N 白い 表紙 の 新しい 本 ADJ 形容詞 NP 名詞句 PP 助詞句 N 名詞 P 助詞
今回の発表内容 構造解析 ・係り受け解析 ・Shift-Reduce法 ・SMT法 ・句構造解析