Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書を人手で作りました
Search
自然言語処理研究室
March 31, 2013
Research
0
61
用言等換言辞書を人手で作りました
山本和英, 吉倉 孝太郎,. 用言等換言辞書を人手で作りました. 言語処理学会第19回年次大会, pp.276-279 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
490
データサイエンス12_分類.pdf
jnlp
0
340
データサイエンス11_前処理.pdf
jnlp
0
460
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
98
自然言語処理研究室 研究概要(2014年)
jnlp
0
120
自然言語処理研究室 研究概要(2015年)
jnlp
0
190
Other Decks in Research
See All in Research
SSII2025 [TS1] 光学・物理原理に基づく深層画像生成
ssii
PRO
4
4.2k
[論文紹介] Intuitive Fine-Tuning
ryou0634
0
110
Stealing LUKS Keys via TPM and UUID Spoofing in 10 Minutes - BSides 2025
anykeyshik
0
120
投資戦略202508
pw
0
560
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
2
1.3k
2025年度人工知能学会全国大会チュートリアル講演「深層基盤モデルの数理」
taiji_suzuki
25
18k
PhD Defense 2025: Visual Understanding of Human Hands in Interactions
tkhkaeio
1
190
SNLP2025:Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
130
なめらかなシステムと運用維持の終わらぬ未来 / dicomo2025_coherently_fittable_system
monochromegane
0
2.9k
Vision and LanguageからのEmbodied AIとAI for Science
yushiku
PRO
1
530
IMC の細かすぎる話 2025
smly
2
630
Learning to (Learn at Test Time): RNNs with Expressive Hidden States
kurita
0
170
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
61k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3k
Git: the NoSQL Database
bkeepers
PRO
431
66k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Building an army of robots
kneath
306
46k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Faster Mobile Websites
deanohume
309
31k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
Automating Front-end Workflow
addyosmani
1370
200k
Typedesign – Prime Four
hannesfritz
42
2.8k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Transcript
(c)長岡技術科学大学 電気系 1/26 用言等換言辞書を 人手で作りました 山本和英 吉倉孝太郎 長岡技術科学大学
(c)長岡技術科学大学 電気系 2/26 発表内容: 1. 換言処理の話 2. 作業内容 3. 結果と今後
(c)長岡技術科学大学 電気系 3/26 1. 換言処理の話
(c)長岡技術科学大学 電気系 4/26 研究の動機: 換言処理したいのに、 一般に利用可能な 汎用日本語換言辞書が 存在しない
(c)長岡技術科学大学 電気系 5/26 なぜ換言処理? 表現の多様性は 自然言語の特質である。 これを正面から扱わない限り、 自然言語処理は進展しない。
(c)長岡技術科学大学 電気系 6/26 表層表現 いわゆる意味表現 以後の 処理へ 理解 理想
(c)長岡技術科学大学 電気系 7/26 表層表現 いわゆる意味表現 理解 現実
(c)長岡技術科学大学 電気系 8/26 表層表現 いわゆる意味表現 理解 現実 これで いいのか?
(c)長岡技術科学大学 電気系 9/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
(c)長岡技術科学大学 電気系 10/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
性能向上 するのでは?
(c)長岡技術科学大学 電気系 11/26 主張:換言処理は、 • 自然言語処理の性能向上に大いに 寄与する。 • 表現平易化(やさしい日本語)や表 現統一(産業日本語)などは社会で
の需要が大きい。 よって、換言処理の進展がどうしても必 要だ。
(c)長岡技術科学大学 電気系 12/26 2. 作業内容
(c)長岡技術科学大学 電気系 13/26 作業の概要 • サ変名詞、動詞、形容詞、副詞を対象 • JUMAN辞書項目が換言対象 – 合計約12,000語
• 1名が手作業で換言 • 短く置換できる語を思い出す • 平易に換言する(難しく換言しない)
(c)長岡技術科学大学 電気系 14/26 言語資源を参照しない 作成時に国語辞典やシソーラスを一切見 ないで作業を行う。直感勝負。 • 作業効率の向上 • 既存の言語資源と同じ情報がほしいの
ではない
(c)長岡技術科学大学 電気系 15/26 無記入を許す • 単語の意味が分からない – 笑み割れる、かがる • 換言できる語を思いつかない
– 投げる、言う、話す • 換言可能でも長い説明を要する – 一進一退する 以上のいずれかに該当する場合に無記入を許 す。
(c)長岡技術科学大学 電気系 16/26 多義語は文脈を付与する • 空を仰ぐ ⇒ 見る • 師匠を仰ぐ ⇒ 尊敬する • 指示を仰ぐ ⇒ 求める
多義語の場合は換言語と共に文脈(赤 字)を記述する。
(c)長岡技術科学大学 電気系 17/26 格変化は記述する • 背く ⇒ 裏切る • 上司に背く ⇒ 上司を裏切る 換言によって格が変化する場合は、 格の変化も記述する。
(c)長岡技術科学大学 電気系 18/26 慣用的表現は まとめて換言する • 入れる ⇒ ? • 手に入れる ⇒ 得る 単語単位で換言できない(広い意味の)
慣用的表現はまとめて換言する。
(c)長岡技術科学大学 電気系 19/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする
(c)長岡技術科学大学 電気系 20/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする • 部屋をきれいに片付ける ⇒ 部屋をきれいにきれいにする 意味が重複して表出する可能性がある 表現は括弧づけする。
(c)長岡技術科学大学 電気系 21/26 3. 結果と今後
(c)長岡技術科学大学 電気系 22/26 作業結果 品詞 換言対象 換言作成 無記入 動詞 3,608語
3,206語 481語 サ変名詞 5,627語 4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 作業期間:5ヶ月程度
(c)長岡技術科学大学 電気系 23/26 辞書の分析 これからです。 • 国語辞典・シソーラスとの関係 • 日本語の基礎語彙との関係
(c)長岡技術科学大学 電気系 24/26 辞書の利用 これからです。 • 人に向けた換言 (表現の平易化、規格化など) • 計算機に向けた換言
(自然言語処理の性能向上)
(c)長岡技術科学大学 電気系 25/26 名詞は換言しないのか? • 名詞も換言辞書を作りたいが、用言等 ほど換言は簡単ではない。 • 検討中。
(c)長岡技術科学大学 電気系 26/26 発表まとめ 用言等換言辞書を 人手で作りました。