Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書を人手で作りました
Search
自然言語処理研究室
March 31, 2013
Research
0
62
用言等換言辞書を人手で作りました
山本和英, 吉倉 孝太郎,. 用言等換言辞書を人手で作りました. 言語処理学会第19回年次大会, pp.276-279 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
510
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
190
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
660
地域丸ごとデイサービス「Go トレ」の紹介
smartfukushilab1
0
930
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
4
670
その推薦システムの評価指標、ユーザーの感覚とズレてるかも
kuri8ive
1
320
CoRL2025速報
rpc
4
4.2k
Ankylosing Spondylitis
ankh2054
0
120
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.4k
大規模言語モデルにおけるData-Centric AIと合成データの活用 / Data-Centric AI and Synthetic Data in Large Language Models
tsurubee
1
500
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
760
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
3
490
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
710
Featured
See All Featured
The untapped power of vector embeddings
frankvandijk
1
1.6k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.1k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
117
110k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
70
For a Future-Friendly Web
brad_frost
182
10k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
160
Documentation Writing (for coders)
carmenintech
77
5.3k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.6k
The Pragmatic Product Professional
lauravandoore
37
7.1k
Crafting Experiences
bethany
1
54
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
100
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
310
Transcript
(c)長岡技術科学大学 電気系 1/26 用言等換言辞書を 人手で作りました 山本和英 吉倉孝太郎 長岡技術科学大学
(c)長岡技術科学大学 電気系 2/26 発表内容: 1. 換言処理の話 2. 作業内容 3. 結果と今後
(c)長岡技術科学大学 電気系 3/26 1. 換言処理の話
(c)長岡技術科学大学 電気系 4/26 研究の動機: 換言処理したいのに、 一般に利用可能な 汎用日本語換言辞書が 存在しない
(c)長岡技術科学大学 電気系 5/26 なぜ換言処理? 表現の多様性は 自然言語の特質である。 これを正面から扱わない限り、 自然言語処理は進展しない。
(c)長岡技術科学大学 電気系 6/26 表層表現 いわゆる意味表現 以後の 処理へ 理解 理想
(c)長岡技術科学大学 電気系 7/26 表層表現 いわゆる意味表現 理解 現実
(c)長岡技術科学大学 電気系 8/26 表層表現 いわゆる意味表現 理解 現実 これで いいのか?
(c)長岡技術科学大学 電気系 9/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
(c)長岡技術科学大学 電気系 10/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
性能向上 するのでは?
(c)長岡技術科学大学 電気系 11/26 主張:換言処理は、 • 自然言語処理の性能向上に大いに 寄与する。 • 表現平易化(やさしい日本語)や表 現統一(産業日本語)などは社会で
の需要が大きい。 よって、換言処理の進展がどうしても必 要だ。
(c)長岡技術科学大学 電気系 12/26 2. 作業内容
(c)長岡技術科学大学 電気系 13/26 作業の概要 • サ変名詞、動詞、形容詞、副詞を対象 • JUMAN辞書項目が換言対象 – 合計約12,000語
• 1名が手作業で換言 • 短く置換できる語を思い出す • 平易に換言する(難しく換言しない)
(c)長岡技術科学大学 電気系 14/26 言語資源を参照しない 作成時に国語辞典やシソーラスを一切見 ないで作業を行う。直感勝負。 • 作業効率の向上 • 既存の言語資源と同じ情報がほしいの
ではない
(c)長岡技術科学大学 電気系 15/26 無記入を許す • 単語の意味が分からない – 笑み割れる、かがる • 換言できる語を思いつかない
– 投げる、言う、話す • 換言可能でも長い説明を要する – 一進一退する 以上のいずれかに該当する場合に無記入を許 す。
(c)長岡技術科学大学 電気系 16/26 多義語は文脈を付与する • 空を仰ぐ ⇒ 見る • 師匠を仰ぐ ⇒ 尊敬する • 指示を仰ぐ ⇒ 求める
多義語の場合は換言語と共に文脈(赤 字)を記述する。
(c)長岡技術科学大学 電気系 17/26 格変化は記述する • 背く ⇒ 裏切る • 上司に背く ⇒ 上司を裏切る 換言によって格が変化する場合は、 格の変化も記述する。
(c)長岡技術科学大学 電気系 18/26 慣用的表現は まとめて換言する • 入れる ⇒ ? • 手に入れる ⇒ 得る 単語単位で換言できない(広い意味の)
慣用的表現はまとめて換言する。
(c)長岡技術科学大学 電気系 19/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする
(c)長岡技術科学大学 電気系 20/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする • 部屋をきれいに片付ける ⇒ 部屋をきれいにきれいにする 意味が重複して表出する可能性がある 表現は括弧づけする。
(c)長岡技術科学大学 電気系 21/26 3. 結果と今後
(c)長岡技術科学大学 電気系 22/26 作業結果 品詞 換言対象 換言作成 無記入 動詞 3,608語
3,206語 481語 サ変名詞 5,627語 4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 作業期間:5ヶ月程度
(c)長岡技術科学大学 電気系 23/26 辞書の分析 これからです。 • 国語辞典・シソーラスとの関係 • 日本語の基礎語彙との関係
(c)長岡技術科学大学 電気系 24/26 辞書の利用 これからです。 • 人に向けた換言 (表現の平易化、規格化など) • 計算機に向けた換言
(自然言語処理の性能向上)
(c)長岡技術科学大学 電気系 25/26 名詞は換言しないのか? • 名詞も換言辞書を作りたいが、用言等 ほど換言は簡単ではない。 • 検討中。
(c)長岡技術科学大学 電気系 26/26 発表まとめ 用言等換言辞書を 人手で作りました。