Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150610 文献紹介
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuta
June 10, 2015
Education
200
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20150610 文献紹介
Yuta
June 10, 2015
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
230
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150820 文献紹介
sudo
0
200
20150708 文献紹介
sudo
0
170
20150512 文献紹介
sudo
0
190
20150415 文献紹介
sudo
1
240
Other Decks in Education
See All in Education
[2026前期火5] 論理学(京都大学文学部 前期 第8回)「正規化定理の証明」
yatabe
0
200
プロポーザルを書く技術とアンチパターン/proposal-writing-and-antipatterns
moriyuya
13
3.5k
Case Studies - Lecture 12 - Information Visualisation (4019538FNR)
signer
PRO
0
150
生成AI時代のエンジニア育成について考えてみた
akasan
0
160
Modern Data Fetching Techniques in Angular
debug_mode
0
220
The Art & Science of Elearning
tmiket
1
230
Where Data Meets Storytelling
georgesinnott
0
120
BITCOIN : Les fondamentaux !
rlifchitz
0
180
Course Review - Lecture 13 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.3k
解決策を教えても次期リーダーは育たない ─ 器の発達に伴走するために / Partnering with leaders in their vertical development
matsu0228
1
460
[2026前期火5] 論理学(京都大学文学部 前期 第4回)「 ならば(→)の導入と証明ネット」
yatabe
0
480
Portable & Reproducible Research Environments in the Age of AI Agents
denkiwakame
0
400
Featured
See All Featured
The SEO identity crisis: Don't let AI make you average
varn
0
500
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Embracing the Ebb and Flow
colly
88
5.1k
Mobile First: as difficult as doing things right
swwweet
225
10k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
400
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
Writing Fast Ruby
sferik
630
63k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
870
Scaling GitHub
holman
464
140k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
350
Unsuck your backbone
ammeep
672
58k
Transcript
/11 文献紹介 日本語機能表現辞書の編纂 松吉 俊, 佐藤 理史, 宇津呂 武仁 自然言語処理
Vol.14(2007) No.5 P123-146 自然言語処理研究室 B4 須戸悠太 1
/11 概要 • 日本語機能表現辞書について提案 • 見出し体系として階層構造を用いる • 各々の見出し語に対してほぼすべての異形が網羅 されている 2
/11 はじめに • 機能語と複合辞を合わせて機能表現と呼ぶ • 機能表現について解析ツールの問題(表記揺れ、複 合語など)を解決しようとする研究はほとんど存在し ない 3 一語
二語以上 内容的 内容語(名詞、動詞、形容詞など) 複合名詞、複合動詞、慣用表現 機能的 機能語(助詞、助動詞、接続詞、形式名詞) 複合辞 日本語表現の分類
/11 日本語機能表現 • 複合辞 「からには」→「から」,「に」,「は」の3つの助詞で構成 • 機能表現について 機能語の列や自立性が低い内容語を含む表現 例:「からには」,「かもしれない」 個々の機能表現に対して多くの異形が存在
4
/11 辞書に求める要件 • 辞書の見出し語に存在する機能表現の出現系の網 羅的なリストが必要 • 求める要件 1. 機能表現の出現形を網羅する見出し体系をもっている こと
2. 関連する機能表現間の関係が明示されていること 3. 個々の機能表現に対して、文法情報や意味などが記述 されていること 5
/11 辞書の設計方針 • 見出し語体系 9つの階層を持つ階層構造 • 辞書の形式 XML形式 • 付加情報
左接続・右接続、意味カテゴリ、難易度、文体、 核、稀、例文、否定表現、慣用表現、 文献への参照、外部辞書の見出し語へのリンク 6
/11 階層構造 • 辞書に求める要件の1と2を満たす 1. 出現形のリストとして、9つめの階層(L9)の機能表現集 合を利用できる 2. 各表現のIDを比較することで表現間の関係を知ること ができる
7
/11 階層構造 8 ダミーノード 見出し語 意味 派生 異形 活用 出現形
/11 階層構造 9 階層 ID 表現数 文字種 長さ L1 見出し語
数字 3 341 L2 意味 数字 1 434 L3 派生 英字(8種) 1 551 L4 機能語の交替 数字 1 769 L5 音韻的変化 英字(38種) 1 1182 L6 とりたて詞の挿入 英字(18種) 1 1805 L7 活用 数字 2 6857 L8 「です/ます」の有無 英字(2種) 1 9705 L9 表記のゆれ(出現形) 数字 2 16771
/11 機能表現ID • L9の機能表現に対して、階層構造における位置を 表す 10 機能表現IDの構成
/11 機能表現辞書の編纂 • 次のリストに含まれるすべての機能表現を辞書に収 録した 1. 「日本語表現文型 用例中心・複合辞の意味と用法」 (森田, 松本
1989)より計412表現 2. 「使い方の分かる類語例解辞典 新装版」(遠藤他 2003)より計368表現 • 341の見出し語と16771の出現形が収録された 既存の機能表現リストと比較した結果、各々の見出し語に 対して、ほぼすべての異形が網羅されていた 11