Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
構造解析について
Search
masaya82
January 16, 2018
0
300
構造解析について
masaya82
January 16, 2018
Tweet
Share
More Decks by masaya82
See All by masaya82
文献紹介 : More is not always better: balancing sense distributions for all-words
masaya82
0
140
文献紹介:Enhancing Modern Supervised Word Sense Disambiguation Models
masaya82
0
150
文献紹介:The Word Sense Disambiguation Test Suite at WMT18
masaya82
0
97
文献紹介:Preposition Sense Disambiguation and Representation
masaya82
0
130
文献紹介:Word Sense Disambiguation Based on Word Similarity Calculation Using Word Vector Representation from a Knowledge-based Graph
masaya82
0
150
Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation
masaya82
0
110
Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
masaya82
0
130
Improving Word Sense Disambiguation in Neural Machine Translation with Sense Embeddings
masaya82
0
140
Learning_to_Identify_the_Best_Contexts_for_Knowledge-based_WSD
masaya82
0
130
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
329
39k
A Modern Web Designer's Workflow
chriscoyier
697
190k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
Building an army of robots
kneath
306
46k
How to train your dragon (web standard)
notwaldorf
97
6.3k
Leading Effective Engineering Teams in the AI Era
addyosmani
7
530
Into the Great Unknown - MozCon
thekraken
40
2.1k
Building a Scalable Design System with Sketch
lauravandoore
463
33k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
230
22k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
30
2.9k
Balancing Empowerment & Direction
lara
5
690
Transcript
構造解析について 自然言語処理研究室 B3 福嶋 真也
参考文献 • 「自然言語処理の基本と技術」 2章 著者 奥野 陽、グラム・ニュービッグ、萩原 正人 • 株式会社
翔泳社 発行
文の構造の曖昧性 例:白い表紙の新しい本 日本語での解釈 1.新しい本があって、その本の表紙が白い 2.白い本があって、その本の表紙が新しい 3.本があって、その本の表紙が新しくて白い 英訳 1.the new book
with the white cover 2.the white book with the new cover 3.the book with the white new cover
係り受け構造 文中の単語の関係性を矢印で表示 例: 1.白い 表紙 の 新しい 本 2.白い 表紙
の 新しい 本 3.白い 表紙 の 新しい 本 1.新しい本があって、その本の表紙が白い 2.白い本があって、その本の表紙が新しい 3.本があって、その本の表紙が新しくて白い
係り受け構造 用語 ・親(主辞)・・・矢印のさす単語 ・子(従属語)・・・矢印が出ている単語 日本語における係り受け構造の特徴 ・ふつう親は子より右側に位置する the new book with
the white cover つまり機械的に左から右へ解析を行うことが可能 英語
係り受け解析 自動的に係り受け構造を文に付与する技術 ・Shift-Reduce法 Shift・・・未処理単語列から、最初の単語を木の集合に移動さ せる Reduce・・・木の集合の内、右から2番目の木から、右から1番 の木へ矢印を引く 機械学習に基づいてこれらの操作を選択、実行して解析を行う
係り受け解析 例: 白い 表紙 の 新しい 本 白い 表紙 の
新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 白い 表紙 の 新しい 本 shift reduce shift shift shift shift reduce reduce reduce
係り受け解析 英語のような後ろから修飾ができるような言語でも使用可能 →その場合reduceの操作に操作の方向を指定するright、left が必要に(reduce-right、reduce-left) Shift-Reduce法のメリット ・解析速度 デメリット ・精度
係り受け解析 ・MST(Minimum Spaning Tree)法 文全体の係り受けを同時に解析 文中の単語の組から機械学習に基づいて係り受けが存在する 確率を計算し、グラフ構造に表す。これから最適な木を探す メリット ・ Shift-Reduce法より多少精度がよい
デメリット ・処理時間がかかる
係り受け解析 例: 文)白い 表紙 の 新しい 本 グラフ) 木) 白い
表紙 の 本 新しい 白い 表紙 の 本 新しい スコア付け 木の探索
句構造解析 係り受け解析と同じく、文の構造を知る手法 句に注目して解析 主に語順が決まっている言語に対して使用 主な句 ・動詞句 ・名詞句 ・形容詞句 ・名詞句 ・助詞句
句構造解析 例:白い表紙の新しい本 (新しい本があって、その本の表紙が白い) NP PP NP ADJ N P ADJ
N 白い 表紙 の 新しい 本 ADJ 形容詞 NP 名詞句 PP 助詞句 N 名詞 P 助詞
今回の発表内容 構造解析 ・係り受け解析 ・Shift-Reduce法 ・SMT法 ・句構造解析