Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
構造解析について
Search
masaya82
January 16, 2018
0
290
構造解析について
masaya82
January 16, 2018
Tweet
Share
More Decks by masaya82
See All by masaya82
文献紹介 : More is not always better: balancing sense distributions for all-words
masaya82
0
140
文献紹介:Enhancing Modern Supervised Word Sense Disambiguation Models
masaya82
0
150
文献紹介:The Word Sense Disambiguation Test Suite at WMT18
masaya82
0
88
文献紹介:Preposition Sense Disambiguation and Representation
masaya82
0
120
文献紹介:Word Sense Disambiguation Based on Word Similarity Calculation Using Word Vector Representation from a Knowledge-based Graph
masaya82
0
140
Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation
masaya82
0
99
Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
masaya82
0
120
Improving Word Sense Disambiguation in Neural Machine Translation with Sense Embeddings
masaya82
0
130
Learning_to_Identify_the_Best_Contexts_for_Knowledge-based_WSD
masaya82
0
120
Featured
See All Featured
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Into the Great Unknown - MozCon
thekraken
40
1.9k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.4k
Scaling GitHub
holman
460
140k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Building an army of robots
kneath
306
45k
Building Adaptive Systems
keathley
43
2.7k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Navigating Team Friction
lara
187
15k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Transcript
構造解析について 自然言語処理研究室 B3 福嶋 真也
参考文献 • 「自然言語処理の基本と技術」 2章 著者 奥野 陽、グラム・ニュービッグ、萩原 正人 • 株式会社
翔泳社 発行
文の構造の曖昧性 例:白い表紙の新しい本 日本語での解釈 1.新しい本があって、その本の表紙が白い 2.白い本があって、その本の表紙が新しい 3.本があって、その本の表紙が新しくて白い 英訳 1.the new book
with the white cover 2.the white book with the new cover 3.the book with the white new cover
係り受け構造 文中の単語の関係性を矢印で表示 例: 1.白い 表紙 の 新しい 本 2.白い 表紙
の 新しい 本 3.白い 表紙 の 新しい 本 1.新しい本があって、その本の表紙が白い 2.白い本があって、その本の表紙が新しい 3.本があって、その本の表紙が新しくて白い
係り受け構造 用語 ・親(主辞)・・・矢印のさす単語 ・子(従属語)・・・矢印が出ている単語 日本語における係り受け構造の特徴 ・ふつう親は子より右側に位置する the new book with
the white cover つまり機械的に左から右へ解析を行うことが可能 英語
係り受け解析 自動的に係り受け構造を文に付与する技術 ・Shift-Reduce法 Shift・・・未処理単語列から、最初の単語を木の集合に移動さ せる Reduce・・・木の集合の内、右から2番目の木から、右から1番 の木へ矢印を引く 機械学習に基づいてこれらの操作を選択、実行して解析を行う
係り受け解析 例: 白い 表紙 の 新しい 本 白い 表紙 の
新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 shift reduce shift shift shift shift reduce reduce reduce
係り受け解析 英語のような後ろから修飾ができるような言語でも使用可能 →その場合reduceの操作に操作の方向を指定するright、left が必要に(reduce-right、reduce-left) Shift-Reduce法のメリット ・解析速度 デメリット ・精度
係り受け解析 ・MST(Minimum Spaning Tree)法 文全体の係り受けを同時に解析 文中の単語の組から機械学習に基づいて係り受けが存在する 確率を計算し、グラフ構造に表す。これから最適な木を探す メリット ・ Shift-Reduce法より多少精度がよい
デメリット ・処理時間がかかる
係り受け解析 例: 文)白い 表紙 の 新しい 本 グラフ) 木) 白い
表紙 の 本 新しい 白い 表紙 の 本 新しい スコア付け 木の探索
句構造解析 係り受け解析と同じく、文の構造を知る手法 句に注目して解析 主に語順が決まっている言語に対して使用 主な句 ・動詞句 ・名詞句 ・形容詞句 ・名詞句 ・助詞句
句構造解析 例:白い表紙の新しい本 (新しい本があって、その本の表紙が白い) NP PP NP ADJ N P ADJ
N 白い 表紙 の 新しい 本 ADJ 形容詞 NP 名詞句 PP 助詞句 N 名詞 P 助詞
今回の発表内容 構造解析 ・係り受け解析 ・Shift-Reduce法 ・SMT法 ・句構造解析