Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150109 発表資料
Search
Yuta
January 09, 2015
Education
0
150
20150109 発表資料
Yuta
January 09, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
Other Decks in Education
See All in Education
東大1年生にJulia教えてみた
matsui_528
7
12k
Postcards
gabrielramirezv
0
160
ブランチ操作 / 02-a-branch
kaityo256
PRO
0
200
LotusScript でエージェント情報を出力してみた
harunakano
0
150
AIで日本はどう進化する? 〜キミが生きる2035年の地図〜
behomazn
0
130
地区危機管理委員会 出前セミナー「ロータリーにおける危機管理」:膳所 和彦 氏(国際ロータリー第2720地区 パストガバナー・日田ロータリークラブ・医療法人恒心会ぜぜ医院 理事長):2720 Japan O.K. ロータリーEクラブ2026年2月16日卓話
2720japanoke
1
600
Flinga
matleenalaakso
4
15k
小さなまちで始める デジタル創作の居場所〜すべての子どもが創造的に未来を描ける社会へ〜
codeforeveryone
0
180
Railsチュートリアル × 反転学習の事例紹介
yasslab
PRO
3
170k
IHLヘルスケアリーダーシップ研究会17期説明資料
ihlhealthcareleadership
0
2.1k
Human Perception and Colour Theory - Lecture 2 - Information Visualisation (4019538FNR)
signer
PRO
0
3k
環境・社会理工学院(建築学系)大学院説明会 2026|東京科学大学(Science Tokyo)
sciencetokyo
PRO
0
530
Featured
See All Featured
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
200
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
140
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
92
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
How GitHub (no longer) Works
holman
316
140k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
300
How to make the Groovebox
asonas
2
2k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
150
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
87
Transcript
形態素解析について 自然言語処理研究室 B3 須戸悠太 1
形態素解析とは • 意味を持つ最小の言語単位(形態素)を対象と した解析プロセス。 • 単語分割・品詞付与・原型の復元の大きく三つ の処理に分けられる。 • 日本語の形態素解析では単語分割が主要な処理 となる。
2
日本語の形態素解析 • 単語辞書と連接可能性行列の二つが知識として 用いられる。 • 次の二つのステップを繰り返すことで単語を ノードとしその間をリンクでつないだグラフ (ラティス)が得られる。 1.各文字の位置から始まる単語を取り出す 2.相前後する2単語で連接可能なものをつなぐ
3
身近な応用例 • 仮名漢字変換 例:ていあんしたいけん 1.ていあん/し/たい/けん→提案したい件 2.ていあん/した/いけん →提案した意見 3.ていあん/し/たいけん →提案し体験 4
選好の紹介 • 最長一致法 できるだけ長い単語で構成される解析結果を優先 して選択する。 • 形態素数(文節数)最小法 入力文字列を構成する形態素数が少ない解析結果 を優先して選択する。 5
プログラムでは • コスト最小法 ノードとリンクにそれぞれ単語コスト、連接コス トを与え、コスト最小のパスを最適解として選択 する。 • ビタビアルゴリズム ラティス中の各ノードにおいて、部分コストの最 小値及びそのリンクを記憶する。
6
形態素解析の欠点 • 単語辞書に登録されていない未知後を含む場合、 解析性能を劣化させる可能性がある。 • コスト最小法では、コストを人手で与える必要 がある。 7
解析ツール • JUMAN 辞書や品詞体系、連接規則などを外部化し、カス タマイズを可能にした。 • 茶筌 コスト推定を統計的な手法によって行う。 • MeCab
辞書や定義ファイルを入れ替えることで日本語形 態素解析以外にも応用可能。 8