Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書を人手で作りました
Search
自然言語処理研究室
March 31, 2013
Research
0
62
用言等換言辞書を人手で作りました
山本和英, 吉倉 孝太郎,. 用言等換言辞書を人手で作りました. 言語処理学会第19回年次大会, pp.276-279 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
390
データサイエンス13_解析.pdf
jnlp
0
500
データサイエンス12_分類.pdf
jnlp
0
350
データサイエンス11_前処理.pdf
jnlp
0
470
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
140
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
130
自然言語処理研究室 研究概要(2015年)
jnlp
0
210
Other Decks in Research
See All in Research
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
4
320
20250725-bet-ai-day
cipepser
3
540
大学見本市2025 JSTさきがけ事業セミナー「顔の見えないセンシング技術:多様なセンサにもとづく個人情報に配慮した人物状態推定」
miso2024
0
190
不確実性下における目的と手段の統合的探索に向けた連続腕バンディットの応用 / iot70_gp_rff_mab
monochromegane
2
250
CVPR2025論文紹介:Unboxed
murakawatakuya
0
220
POI: Proof of Identity
katsyoshi
0
120
高畑鬼界ヶ島と重文・称名寺本薬師如来像の来歴を追って/kikaigashima
kochizufan
0
100
能動適応的実験計画
masakat0
2
1.1k
思いつきが武器になる:研究というゲームを始めよう / Ideas Are Your Equipments : Let the Game of Research Begin!
ks91
PRO
0
100
IMC の細かすぎる話 2025
smly
2
770
論文紹介: ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement
hisaokatsumi
0
140
説明可能な機械学習と数理最適化
kelicht
2
670
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Bash Introduction
62gerente
615
210k
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
The Cult of Friendly URLs
andyhume
79
6.7k
How to Think Like a Performance Engineer
csswizardry
28
2.4k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.6k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Facilitating Awesome Meetings
lara
57
6.7k
Fireside Chat
paigeccino
41
3.7k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Transcript
(c)長岡技術科学大学 電気系 1/26 用言等換言辞書を 人手で作りました 山本和英 吉倉孝太郎 長岡技術科学大学
(c)長岡技術科学大学 電気系 2/26 発表内容: 1. 換言処理の話 2. 作業内容 3. 結果と今後
(c)長岡技術科学大学 電気系 3/26 1. 換言処理の話
(c)長岡技術科学大学 電気系 4/26 研究の動機: 換言処理したいのに、 一般に利用可能な 汎用日本語換言辞書が 存在しない
(c)長岡技術科学大学 電気系 5/26 なぜ換言処理? 表現の多様性は 自然言語の特質である。 これを正面から扱わない限り、 自然言語処理は進展しない。
(c)長岡技術科学大学 電気系 6/26 表層表現 いわゆる意味表現 以後の 処理へ 理解 理想
(c)長岡技術科学大学 電気系 7/26 表層表現 いわゆる意味表現 理解 現実
(c)長岡技術科学大学 電気系 8/26 表層表現 いわゆる意味表現 理解 現実 これで いいのか?
(c)長岡技術科学大学 電気系 9/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
(c)長岡技術科学大学 電気系 10/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
性能向上 するのでは?
(c)長岡技術科学大学 電気系 11/26 主張:換言処理は、 • 自然言語処理の性能向上に大いに 寄与する。 • 表現平易化(やさしい日本語)や表 現統一(産業日本語)などは社会で
の需要が大きい。 よって、換言処理の進展がどうしても必 要だ。
(c)長岡技術科学大学 電気系 12/26 2. 作業内容
(c)長岡技術科学大学 電気系 13/26 作業の概要 • サ変名詞、動詞、形容詞、副詞を対象 • JUMAN辞書項目が換言対象 – 合計約12,000語
• 1名が手作業で換言 • 短く置換できる語を思い出す • 平易に換言する(難しく換言しない)
(c)長岡技術科学大学 電気系 14/26 言語資源を参照しない 作成時に国語辞典やシソーラスを一切見 ないで作業を行う。直感勝負。 • 作業効率の向上 • 既存の言語資源と同じ情報がほしいの
ではない
(c)長岡技術科学大学 電気系 15/26 無記入を許す • 単語の意味が分からない – 笑み割れる、かがる • 換言できる語を思いつかない
– 投げる、言う、話す • 換言可能でも長い説明を要する – 一進一退する 以上のいずれかに該当する場合に無記入を許 す。
(c)長岡技術科学大学 電気系 16/26 多義語は文脈を付与する • 空を仰ぐ ⇒ 見る • 師匠を仰ぐ ⇒ 尊敬する • 指示を仰ぐ ⇒ 求める
多義語の場合は換言語と共に文脈(赤 字)を記述する。
(c)長岡技術科学大学 電気系 17/26 格変化は記述する • 背く ⇒ 裏切る • 上司に背く ⇒ 上司を裏切る 換言によって格が変化する場合は、 格の変化も記述する。
(c)長岡技術科学大学 電気系 18/26 慣用的表現は まとめて換言する • 入れる ⇒ ? • 手に入れる ⇒ 得る 単語単位で換言できない(広い意味の)
慣用的表現はまとめて換言する。
(c)長岡技術科学大学 電気系 19/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする
(c)長岡技術科学大学 電気系 20/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする • 部屋をきれいに片付ける ⇒ 部屋をきれいにきれいにする 意味が重複して表出する可能性がある 表現は括弧づけする。
(c)長岡技術科学大学 電気系 21/26 3. 結果と今後
(c)長岡技術科学大学 電気系 22/26 作業結果 品詞 換言対象 換言作成 無記入 動詞 3,608語
3,206語 481語 サ変名詞 5,627語 4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 作業期間:5ヶ月程度
(c)長岡技術科学大学 電気系 23/26 辞書の分析 これからです。 • 国語辞典・シソーラスとの関係 • 日本語の基礎語彙との関係
(c)長岡技術科学大学 電気系 24/26 辞書の利用 これからです。 • 人に向けた換言 (表現の平易化、規格化など) • 計算機に向けた換言
(自然言語処理の性能向上)
(c)長岡技術科学大学 電気系 25/26 名詞は換言しないのか? • 名詞も換言辞書を作りたいが、用言等 ほど換言は簡単ではない。 • 検討中。
(c)長岡技術科学大学 電気系 26/26 発表まとめ 用言等換言辞書を 人手で作りました。