Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書の構築
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
自然言語処理研究室
March 31, 2013
Research
0
110
用言等換言辞書の構築
吉倉 孝太郎. 用言等換言辞書の構築. 長岡技術科学大学課題研究報告書. (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
510
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
0
230
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
550
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
37k
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
190
Community Driveプロジェクト(CDPJ)の中間報告
smartfukushilab1
0
170
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1.2k
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
290
財務諸表監査のための逐次検定
masakat0
1
250
Ankylosing Spondylitis
ankh2054
0
120
離散凸解析に基づく予測付き離散最適化手法 (IBIS '25)
taihei_oki
PRO
1
690
Remote sensing × Multi-modal meta survey
satai
4
710
ACL読み会2025: Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
130
Featured
See All Featured
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
55
Exploring anti-patterns in Rails
aemeredith
2
250
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
470
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
HDC tutorial
michielstock
1
390
Paper Plane
katiecoart
PRO
0
46k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
94
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.4k
Evolving SEO for Evolving Search Engines
ryanjones
0
130
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.9k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Transcript
電気系 山本研究室 09319689 吉倉 孝太郎
換言:ある言語表現を別の言語表現に変換する処理 犬と散歩する → 犬と歩く 散歩すると歩くは換言可能な対である このような換言可能な対を集めることで ・文章の平易化 ・語彙の制限による処理精度の向上
・シソーラス(上位下位関係を使って換言) ・国語辞書の語釈文 などを用いて換言処理を行なっている →これらの換言が人間の感覚に沿った換言 となっているかどうか検討されていない
人間の感覚に沿った平易な換言を行いたい →現状、人間の感覚に沿った換言を行うための →言語資源は存在しない →本研究では人間の感覚に沿って平易に →換言することの出来る言語資源を構築する
・換言対象語は形態素解析器JUMANから抽出 ・換言対象語の品詞は動詞、サ変名詞、形容詞、副詞 ・なるべく平易な表現に換言する ・換言にはシソーラスや国語辞書等は利用しない
換言の流れ:例として動詞”和える”を利用 ①”和える”を使った例文を考える ごまと和える ②”和える”と置き換えて意味の通じる語を考えて換言 ごまと和える → ごまと混ぜる ③”和える”と”混ぜる”は換言可能として辞書に追加 和える-混ぜる の対を取得
効率良く構築するため以下の場合換言しない ・より平易な表現が思いつかない →投げる、言う、話す など ・換言するときの必要語数が多い →一進一退する など ・意味が明確に分からない →笑み割れる、かがる など
品詞 換言対象語数 換言対作成数 無記入数 動詞 3,608語 3,206語 481語 サ変名詞 5,627語
4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 →およそ13,000語の単語を換言して 約10,000語の換言対を得られた
・無記入としたものについて 換言困難と判断したものがおおよそ3分の1 理解できない換言対象語がおおよそ3分の2となった →無記入の妥当性や理解できないものへの対策 今回構築した辞書を用いて換言出来るようになった →実際に換言を行った結果を考察し、 →辞書に反映させることで辞書の質を向上させる
ご清聴ありがとうございました。
・多義性がある語の換言 複数文脈に使われる可能性のある語を換言する場合 それぞれについて換言を行う。 例:仰ぐの場合 空を仰ぐ → 空を見る 師匠を仰ぐ → 師匠を尊敬する
指示を仰ぐ → 指示を求める この場合、仰ぐの候補は3つ全て追加することになる
・格変化を伴う換言 換言する際に格関係を修正する必要がある場合がある 例:背く 上司に背く → 上司に裏切る →不適切 上司に背く → 上司を裏切る
→適切 この場合「に背く」を「を裏切る」へと換言することになる
・慣用的表現 複数形態素の一部に換言する語が含まれている 例:入れる ギターを手に入れる →入れる単体での換言は不可 →ギターを得るへの換言は可 この場合、手に入れるはまとめて得ると換言する