Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150109 発表資料
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuta
January 09, 2015
Education
160
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20150109 発表資料
Yuta
January 09, 2015
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
230
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150820 文献紹介
sudo
0
200
20150708 文献紹介
sudo
0
170
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
Other Decks in Education
See All in Education
2026年度春学期 統計学 第4回 データを「分布」で見る (2026. 4. 30)
akiraasano
PRO
0
150
2026年度春学期 統計学 第6回 データの関係を知る(1)ー 相関関係 (2026. 5. 14)
akiraasano
PRO
0
130
Implicit and Cross-Device Interaction - Lecture 10 - Next Generation User Interfaces (4018166FNR)
signer
PRO
2
2.3k
AWS Certified Generative AI Developer - Professional Beta 不合格体験記
amarelo_n24
1
400
NDIAS Automotive / IoT CTF 2026 Recap - Keyfob & OSINT
himitu23
0
130
Visualisation Techniques - Lecture 8 - Information Visualisation (4019538FNR)
signer
PRO
1
3.1k
Interaction - Lecture 10 - Information Visualisation (4019538FNR)
signer
PRO
0
2.7k
!コスパよくインターンに受かる方法!
ruribou
1
280
SL AMIGOS 教育格差と私たちの取り組み - スリランカの支援学校への支援プロジェクト:リシンドゥ リオ 氏 (別府溝部学園短期大学 ビジネス観光コース 留学生):2720 Japan O.K. ロータリーEクラブ2026年4月6日卓話
2720japanoke
0
630
「機械学習と因果推論」入門 ③ 漸近効率な推定量と二重機械学習
masakat0
0
700
参加制約理論
roadofhope
0
120
BITCOIN : Les fondamentaux !
rlifchitz
0
180
Featured
See All Featured
Side Projects
sachag
455
43k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
320
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
1k
Building Adaptive Systems
keathley
44
3.1k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
450
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
480
Building the Perfect Custom Keyboard
takai
2
800
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.8k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
240
Transcript
形態素解析について 自然言語処理研究室 B3 須戸悠太 1
形態素解析とは • 意味を持つ最小の言語単位(形態素)を対象と した解析プロセス。 • 単語分割・品詞付与・原型の復元の大きく三つ の処理に分けられる。 • 日本語の形態素解析では単語分割が主要な処理 となる。
2
日本語の形態素解析 • 単語辞書と連接可能性行列の二つが知識として 用いられる。 • 次の二つのステップを繰り返すことで単語を ノードとしその間をリンクでつないだグラフ (ラティス)が得られる。 1.各文字の位置から始まる単語を取り出す 2.相前後する2単語で連接可能なものをつなぐ
3
身近な応用例 • 仮名漢字変換 例:ていあんしたいけん 1.ていあん/し/たい/けん→提案したい件 2.ていあん/した/いけん →提案した意見 3.ていあん/し/たいけん →提案し体験 4
選好の紹介 • 最長一致法 できるだけ長い単語で構成される解析結果を優先 して選択する。 • 形態素数(文節数)最小法 入力文字列を構成する形態素数が少ない解析結果 を優先して選択する。 5
プログラムでは • コスト最小法 ノードとリンクにそれぞれ単語コスト、連接コス トを与え、コスト最小のパスを最適解として選択 する。 • ビタビアルゴリズム ラティス中の各ノードにおいて、部分コストの最 小値及びそのリンクを記憶する。
6
形態素解析の欠点 • 単語辞書に登録されていない未知後を含む場合、 解析性能を劣化させる可能性がある。 • コスト最小法では、コストを人手で与える必要 がある。 7
解析ツール • JUMAN 辞書や品詞体系、連接規則などを外部化し、カス タマイズを可能にした。 • 茶筌 コスト推定を統計的な手法によって行う。 • MeCab
辞書や定義ファイルを入れ替えることで日本語形 態素解析以外にも応用可能。 8