Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
12章 後半
Search
Yuta
December 15, 2014
Education
1
250
12章 後半
Yuta
December 15, 2014
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
170
NLP2016 報告
sudo
0
190
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
260
20150909 発表資料
sudo
0
140
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
190
20150512 文献紹介
sudo
0
180
Other Decks in Education
See All in Education
データ分析
takenawa
0
6.7k
Dashboards - Lecture 11 - Information Visualisation (4019538FNR)
signer
PRO
1
2.1k
JPCERTから始まる草の根活動~セキュリティ文化醸成のためのアクション~
masakiokuda
0
190
技術勉強会 〜 OAuth & OIDC 入門編 / 20250528 OAuth and OIDC
oidfj
5
1.3k
SkimaTalk Tutorial for Corporate Customers
skimatalk
0
290
20250625_なんでもCopilot 一年の振り返り
ponponmikankan
0
230
ANS-C01_2回不合格から合格までの道程
amarelo_n24
1
260
OpenSourceSummitJapanを運営してみた話
kujiraitakahiro
0
720
『会社を知ってもらう』から『安心して活躍してもらう』までの プロセスとフロー
sasakendayo
0
240
生成AI
takenawa
0
6.7k
実務プログラム
takenawa
0
6.6k
Open Source Summit Japan 2025のボランティアをしませんか
kujiraitakahiro
0
730
Featured
See All Featured
Adopting Sorbet at Scale
ufuk
77
9.5k
Testing 201, or: Great Expectations
jmmastey
43
7.6k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
181
54k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.4k
What's in a price? How to price your products and services
michaelherold
246
12k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
[RailsConf 2023] Rails as a piece of cake
palkan
55
5.7k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Transcript
12.3.1 句構造解析 ・文脈自由文法(8章参照)を用いた構文解析は、 英語のような語順に強い制約のある言語を 定義するのに向いている。 ・日本語に対しては、文節間の係り受けを規定する 依存文法を用いるのが自然。
12.3.2 文節チャンキング ・文節:文を意味上、発音上から不自然でない程度に切った 最小の言語単位 ・日本語は語順が比較的自由 →文節の順序が比較的自由ということであり、 文節内の構造及び語順には強い権限がある →日本語は文節の連続として解析するのが自然 ・最も基礎となる技術 →文を文節の単位に区切るチャンキング
12.3.3~4 解析器 ・CaboCha 日本語係り受け解析器であり、固有表現解析などの 豊富な機能を持つ ・KNP ウェブから獲得した大規模格フレームを用いた高精度な 係り受け解析及び格解析を行う
12.3.5 係り受け解析 ・ある文における単語間の依存関係は、単語を節点、 依存関係を辺としたグラフで表現できるが以下の条件を仮説 1. グラフは連結 2. 各単語は係り先を最大で1つ持つ 3.グラフの中に閉路は存在しない 4.係り受け閉路は交差しない(非交差条件)
5.後方を修飾する(日本語の係り受けの条件)
12.4.1 格フレームとその獲得 ・格:名詞句の文法的及び意味的な役割を表したラベル。 ・格フレーム:動詞などの用言を中心とした時、それらが 取りうる各要素の構成パターン
12.4.5 述語項構造解析 ・述語項構造(10.3章)とは、述語と項(格)との関係を表した 構造であり、意味関係を記述したものである ・述語項構造解析は、文中の各述語について、その熟語に 対する項を同定するタスクである。
12.4.6 照応解析 ・照応解析は、機械翻訳や談話解析などにとって、 重要なタスクである。一方で省略の多い日本語にとって はさらに難しい。 ・照応解析は以下の2ステップから構成 1.解析が必要な照応詞を特定 2.先行詞を決定