Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150610 文献紹介
Search
Yuta
June 10, 2015
Education
0
190
20150610 文献紹介
Yuta
June 10, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
170
NLP2016 報告
sudo
0
190
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
260
20150909 発表資料
sudo
0
140
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150512 文献紹介
sudo
0
180
20150415 文献紹介
sudo
1
230
Other Decks in Education
See All in Education
小さなチャレンジが生んだチームの大きな変化 -私のふりかえり探求の原点
callas1900
0
550
アウトプット0のエンジニアが半年でアウトプットしまくった話 With JAWS-UG
masakiokuda
2
320
AIC 103 - Applications of Property Valuation: Essential Slides
rmccaic
0
230
SkimaTalk Introduction for Students
skimatalk
0
390
Pythonパッケージ管理 [uv] 完全入門
mickey_kubo
20
15k
演習問題
takenawa
0
6.6k
技術勉強会 〜 OAuth & OIDC 入門編 / 20250528 OAuth and OIDC
oidfj
5
1.3k
データ分析
takenawa
0
6.6k
Virtual and Augmented Reality - Lecture 8 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.7k
日本の教育の未来 を考える テクノロジーは教育をどのように変えるのか
kzkmaeda
1
210
より良い学振申請書(DC)を作ろう 2025
luiyoshida
1
3.3k
2025.05.10 技術書とVoicyとわたし #RPALT
kaitou
1
230
Featured
See All Featured
Bash Introduction
62gerente
613
210k
Typedesign – Prime Four
hannesfritz
42
2.7k
How GitHub (no longer) Works
holman
314
140k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Thoughts on Productivity
jonyablonski
69
4.7k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
510
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
The Invisible Side of Design
smashingmag
301
51k
Producing Creativity
orderedlist
PRO
346
40k
Transcript
/11 文献紹介 日本語機能表現辞書の編纂 松吉 俊, 佐藤 理史, 宇津呂 武仁 自然言語処理
Vol.14(2007) No.5 P123-146 自然言語処理研究室 B4 須戸悠太 1
/11 概要 • 日本語機能表現辞書について提案 • 見出し体系として階層構造を用いる • 各々の見出し語に対してほぼすべての異形が網羅 されている 2
/11 はじめに • 機能語と複合辞を合わせて機能表現と呼ぶ • 機能表現について解析ツールの問題(表記揺れ、複 合語など)を解決しようとする研究はほとんど存在し ない 3 一語
二語以上 内容的 内容語(名詞、動詞、形容詞など) 複合名詞、複合動詞、慣用表現 機能的 機能語(助詞、助動詞、接続詞、形式名詞) 複合辞 日本語表現の分類
/11 日本語機能表現 • 複合辞 「からには」→「から」,「に」,「は」の3つの助詞で構成 • 機能表現について 機能語の列や自立性が低い内容語を含む表現 例:「からには」,「かもしれない」 個々の機能表現に対して多くの異形が存在
4
/11 辞書に求める要件 • 辞書の見出し語に存在する機能表現の出現系の網 羅的なリストが必要 • 求める要件 1. 機能表現の出現形を網羅する見出し体系をもっている こと
2. 関連する機能表現間の関係が明示されていること 3. 個々の機能表現に対して、文法情報や意味などが記述 されていること 5
/11 辞書の設計方針 • 見出し語体系 9つの階層を持つ階層構造 • 辞書の形式 XML形式 • 付加情報
左接続・右接続、意味カテゴリ、難易度、文体、 核、稀、例文、否定表現、慣用表現、 文献への参照、外部辞書の見出し語へのリンク 6
/11 階層構造 • 辞書に求める要件の1と2を満たす 1. 出現形のリストとして、9つめの階層(L9)の機能表現集 合を利用できる 2. 各表現のIDを比較することで表現間の関係を知ること ができる
7
/11 階層構造 8 ダミーノード 見出し語 意味 派生 異形 活用 出現形
/11 階層構造 9 階層 ID 表現数 文字種 長さ L1 見出し語
数字 3 341 L2 意味 数字 1 434 L3 派生 英字(8種) 1 551 L4 機能語の交替 数字 1 769 L5 音韻的変化 英字(38種) 1 1182 L6 とりたて詞の挿入 英字(18種) 1 1805 L7 活用 数字 2 6857 L8 「です/ます」の有無 英字(2種) 1 9705 L9 表記のゆれ(出現形) 数字 2 16771
/11 機能表現ID • L9の機能表現に対して、階層構造における位置を 表す 10 機能表現IDの構成
/11 機能表現辞書の編纂 • 次のリストに含まれるすべての機能表現を辞書に収 録した 1. 「日本語表現文型 用例中心・複合辞の意味と用法」 (森田, 松本
1989)より計412表現 2. 「使い方の分かる類語例解辞典 新装版」(遠藤他 2003)より計368表現 • 341の見出し語と16771の出現形が収録された 既存の機能表現リストと比較した結果、各々の見出し語に 対して、ほぼすべての異形が網羅されていた 11