Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150610 文献紹介
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuta
June 10, 2015
Education
0
200
20150610 文献紹介
Yuta
June 10, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150512 文献紹介
sudo
0
190
20150415 文献紹介
sudo
1
240
Other Decks in Education
See All in Education
Chapitre_2_-_Partie_2.pdf
bernhardsvt
0
170
滑空スポーツ講習会2025(実技講習)EMFT講習 実施要領/JSA EMFT 2025 procedure
jsaseminar
0
110
2026 Medicare 101 Presentation
robinlee
PRO
0
110
【旧:ZEPメタバース校舎操作ガイド】
ainischool
0
800
Introduction - Lecture 1 - Information Visualisation (4019538FNR)
signer
PRO
0
5.1k
【ベテランCTOからのメッセージ】AIとか組織とかキャリアとか気になることはあるけどさ、個人の技術力から目を背けないでやっていきましょうよ
netmarkjp
2
2.9k
栃木にいても「だいじ」だっぺ〜! 栃木&全国アジャイルコミュニティへの参加・運営の魅力
sasakendayo
1
150
2025年の本当に大事なAI動向まとめ
frievea
0
170
Postcards
gabrielramirezv
0
110
【洋書和訳:さよならを待つふたりのために】第1章 出会いとメタファー
yaginumatti
0
250
おひとり様Organizations管理者もルートアクセス管理を有効にしよう!
amarelo_n24
1
100
【dip】「なりたい自分」に近づくための、「自分と向き合う」小さな振り返り
dip_tech
PRO
0
230
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.9k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
120
Context Engineering - Making Every Token Count
addyosmani
9
660
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
590
GraphQLの誤解/rethinking-graphql
sonatard
74
11k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
830
Build your cross-platform service in a week with App Engine
jlugia
234
18k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
120
Are puppies a ranking factor?
jonoalderson
1
2.7k
GraphQLとの向き合い方2022年版
quramy
50
14k
The agentic SEO stack - context over prompts
schlessera
0
640
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
170
Transcript
/11 文献紹介 日本語機能表現辞書の編纂 松吉 俊, 佐藤 理史, 宇津呂 武仁 自然言語処理
Vol.14(2007) No.5 P123-146 自然言語処理研究室 B4 須戸悠太 1
/11 概要 • 日本語機能表現辞書について提案 • 見出し体系として階層構造を用いる • 各々の見出し語に対してほぼすべての異形が網羅 されている 2
/11 はじめに • 機能語と複合辞を合わせて機能表現と呼ぶ • 機能表現について解析ツールの問題(表記揺れ、複 合語など)を解決しようとする研究はほとんど存在し ない 3 一語
二語以上 内容的 内容語(名詞、動詞、形容詞など) 複合名詞、複合動詞、慣用表現 機能的 機能語(助詞、助動詞、接続詞、形式名詞) 複合辞 日本語表現の分類
/11 日本語機能表現 • 複合辞 「からには」→「から」,「に」,「は」の3つの助詞で構成 • 機能表現について 機能語の列や自立性が低い内容語を含む表現 例:「からには」,「かもしれない」 個々の機能表現に対して多くの異形が存在
4
/11 辞書に求める要件 • 辞書の見出し語に存在する機能表現の出現系の網 羅的なリストが必要 • 求める要件 1. 機能表現の出現形を網羅する見出し体系をもっている こと
2. 関連する機能表現間の関係が明示されていること 3. 個々の機能表現に対して、文法情報や意味などが記述 されていること 5
/11 辞書の設計方針 • 見出し語体系 9つの階層を持つ階層構造 • 辞書の形式 XML形式 • 付加情報
左接続・右接続、意味カテゴリ、難易度、文体、 核、稀、例文、否定表現、慣用表現、 文献への参照、外部辞書の見出し語へのリンク 6
/11 階層構造 • 辞書に求める要件の1と2を満たす 1. 出現形のリストとして、9つめの階層(L9)の機能表現集 合を利用できる 2. 各表現のIDを比較することで表現間の関係を知ること ができる
7
/11 階層構造 8 ダミーノード 見出し語 意味 派生 異形 活用 出現形
/11 階層構造 9 階層 ID 表現数 文字種 長さ L1 見出し語
数字 3 341 L2 意味 数字 1 434 L3 派生 英字(8種) 1 551 L4 機能語の交替 数字 1 769 L5 音韻的変化 英字(38種) 1 1182 L6 とりたて詞の挿入 英字(18種) 1 1805 L7 活用 数字 2 6857 L8 「です/ます」の有無 英字(2種) 1 9705 L9 表記のゆれ(出現形) 数字 2 16771
/11 機能表現ID • L9の機能表現に対して、階層構造における位置を 表す 10 機能表現IDの構成
/11 機能表現辞書の編纂 • 次のリストに含まれるすべての機能表現を辞書に収 録した 1. 「日本語表現文型 用例中心・複合辞の意味と用法」 (森田, 松本
1989)より計412表現 2. 「使い方の分かる類語例解辞典 新装版」(遠藤他 2003)より計368表現 • 341の見出し語と16771の出現形が収録された 既存の機能表現リストと比較した結果、各々の見出し語に 対して、ほぼすべての異形が網羅されていた 11