Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書を人手で作りました
Search
自然言語処理研究室
March 31, 2013
Research
0
63
用言等換言辞書を人手で作りました
山本和英, 吉倉 孝太郎,. 用言等換言辞書を人手で作りました. 言語処理学会第19回年次大会, pp.276-279 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
520
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
150
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
第66回コンピュータビジョン勉強会@関東 Epona: Autoregressive Diffusion World Model for Autonomous Driving
kentosasaki
0
500
データサイエンティストの業務変化
datascientistsociety
PRO
0
310
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
16
23k
20年前に50代だった人たちの今
hysmrk
0
170
明日から使える!研究効率化ツール入門
matsui_528
10
5.5k
From Data Meshes to Data Spaces
posedio
PRO
0
480
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
210
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
210
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
980
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
160
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
990
都市交通マスタープランとその後への期待@熊本商工会議所・熊本経済同友会
trafficbrain
0
180
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
410
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.8k
Building AI with AI
inesmontani
PRO
1
820
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.7k
Building the Perfect Custom Keyboard
takai
2
720
Done Done
chrislema
186
16k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
330
Amusing Abliteration
ianozsvald
0
140
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
160
New Earth Scene 8
popppiees
1
1.8k
Transcript
(c)長岡技術科学大学 電気系 1/26 用言等換言辞書を 人手で作りました 山本和英 吉倉孝太郎 長岡技術科学大学
(c)長岡技術科学大学 電気系 2/26 発表内容: 1. 換言処理の話 2. 作業内容 3. 結果と今後
(c)長岡技術科学大学 電気系 3/26 1. 換言処理の話
(c)長岡技術科学大学 電気系 4/26 研究の動機: 換言処理したいのに、 一般に利用可能な 汎用日本語換言辞書が 存在しない
(c)長岡技術科学大学 電気系 5/26 なぜ換言処理? 表現の多様性は 自然言語の特質である。 これを正面から扱わない限り、 自然言語処理は進展しない。
(c)長岡技術科学大学 電気系 6/26 表層表現 いわゆる意味表現 以後の 処理へ 理解 理想
(c)長岡技術科学大学 電気系 7/26 表層表現 いわゆる意味表現 理解 現実
(c)長岡技術科学大学 電気系 8/26 表層表現 いわゆる意味表現 理解 現実 これで いいのか?
(c)長岡技術科学大学 電気系 9/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
(c)長岡技術科学大学 電気系 10/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
性能向上 するのでは?
(c)長岡技術科学大学 電気系 11/26 主張:換言処理は、 • 自然言語処理の性能向上に大いに 寄与する。 • 表現平易化(やさしい日本語)や表 現統一(産業日本語)などは社会で
の需要が大きい。 よって、換言処理の進展がどうしても必 要だ。
(c)長岡技術科学大学 電気系 12/26 2. 作業内容
(c)長岡技術科学大学 電気系 13/26 作業の概要 • サ変名詞、動詞、形容詞、副詞を対象 • JUMAN辞書項目が換言対象 – 合計約12,000語
• 1名が手作業で換言 • 短く置換できる語を思い出す • 平易に換言する(難しく換言しない)
(c)長岡技術科学大学 電気系 14/26 言語資源を参照しない 作成時に国語辞典やシソーラスを一切見 ないで作業を行う。直感勝負。 • 作業効率の向上 • 既存の言語資源と同じ情報がほしいの
ではない
(c)長岡技術科学大学 電気系 15/26 無記入を許す • 単語の意味が分からない – 笑み割れる、かがる • 換言できる語を思いつかない
– 投げる、言う、話す • 換言可能でも長い説明を要する – 一進一退する 以上のいずれかに該当する場合に無記入を許 す。
(c)長岡技術科学大学 電気系 16/26 多義語は文脈を付与する • 空を仰ぐ ⇒ 見る • 師匠を仰ぐ ⇒ 尊敬する • 指示を仰ぐ ⇒ 求める
多義語の場合は換言語と共に文脈(赤 字)を記述する。
(c)長岡技術科学大学 電気系 17/26 格変化は記述する • 背く ⇒ 裏切る • 上司に背く ⇒ 上司を裏切る 換言によって格が変化する場合は、 格の変化も記述する。
(c)長岡技術科学大学 電気系 18/26 慣用的表現は まとめて換言する • 入れる ⇒ ? • 手に入れる ⇒ 得る 単語単位で換言できない(広い意味の)
慣用的表現はまとめて換言する。
(c)長岡技術科学大学 電気系 19/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする
(c)長岡技術科学大学 電気系 20/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする • 部屋をきれいに片付ける ⇒ 部屋をきれいにきれいにする 意味が重複して表出する可能性がある 表現は括弧づけする。
(c)長岡技術科学大学 電気系 21/26 3. 結果と今後
(c)長岡技術科学大学 電気系 22/26 作業結果 品詞 換言対象 換言作成 無記入 動詞 3,608語
3,206語 481語 サ変名詞 5,627語 4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 作業期間:5ヶ月程度
(c)長岡技術科学大学 電気系 23/26 辞書の分析 これからです。 • 国語辞典・シソーラスとの関係 • 日本語の基礎語彙との関係
(c)長岡技術科学大学 電気系 24/26 辞書の利用 これからです。 • 人に向けた換言 (表現の平易化、規格化など) • 計算機に向けた換言
(自然言語処理の性能向上)
(c)長岡技術科学大学 電気系 25/26 名詞は換言しないのか? • 名詞も換言辞書を作りたいが、用言等 ほど換言は簡単ではない。 • 検討中。
(c)長岡技術科学大学 電気系 26/26 発表まとめ 用言等換言辞書を 人手で作りました。