Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書の構築
Search
自然言語処理研究室
March 31, 2013
Research
0
100
用言等換言辞書の構築
吉倉 孝太郎. 用言等換言辞書の構築. 長岡技術科学大学課題研究報告書. (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
480
データサイエンス12_分類.pdf
jnlp
0
340
データサイエンス11_前処理.pdf
jnlp
0
460
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
97
自然言語処理研究室 研究概要(2014年)
jnlp
0
120
自然言語処理研究室 研究概要(2015年)
jnlp
0
190
Other Decks in Research
See All in Research
Delta Airlines® Customer Care in the U.S.: How to Reach Them Now
bookingcomcustomersupportusa
0
110
VectorLLM: Human-like Extraction of Structured Building Contours via Multimodal LLMs
satai
4
190
20250605_新交通システム推進議連_熊本都市圏「車1割削減、渋滞半減、公共交通2倍」から考える地方都市交通政策
trafficbrain
0
760
電力システム最適化入門
mickey_kubo
1
920
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
shunk031
16
9.9k
CVPR2025論文紹介:Unboxed
murakawatakuya
0
150
Google Agent Development Kit (ADK) 入門 🚀
mickey_kubo
2
1.7k
引力・斥力を制御可能なランダム部分集合の確率分布
wasyro
0
240
【輪講資料】Moshi: a speech-text foundation model for real-time dialogue
hpprc
3
670
一人称視点映像解析の最先端(MIRU2025 チュートリアル)
takumayagi
6
3.4k
集合間Bregmanダイバージェンスと置換不変NNによるその学習
wasyro
0
140
言語モデルの地図:確率分布と情報幾何による類似性の可視化
shimosan
5
1.4k
Featured
See All Featured
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.5k
How STYLIGHT went responsive
nonsquared
100
5.8k
The Pragmatic Product Professional
lauravandoore
36
6.9k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Rails Girls Zürich Keynote
gr2m
95
14k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
The Art of Programming - Codeland 2020
erikaheidi
56
13k
Mobile First: as difficult as doing things right
swwweet
224
9.9k
Done Done
chrislema
185
16k
Statistics for Hackers
jakevdp
799
220k
GitHub's CSS Performance
jonrohan
1032
460k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
920
Transcript
電気系 山本研究室 09319689 吉倉 孝太郎
換言:ある言語表現を別の言語表現に変換する処理 犬と散歩する → 犬と歩く 散歩すると歩くは換言可能な対である このような換言可能な対を集めることで ・文章の平易化 ・語彙の制限による処理精度の向上
・シソーラス(上位下位関係を使って換言) ・国語辞書の語釈文 などを用いて換言処理を行なっている →これらの換言が人間の感覚に沿った換言 となっているかどうか検討されていない
人間の感覚に沿った平易な換言を行いたい →現状、人間の感覚に沿った換言を行うための →言語資源は存在しない →本研究では人間の感覚に沿って平易に →換言することの出来る言語資源を構築する
・換言対象語は形態素解析器JUMANから抽出 ・換言対象語の品詞は動詞、サ変名詞、形容詞、副詞 ・なるべく平易な表現に換言する ・換言にはシソーラスや国語辞書等は利用しない
換言の流れ:例として動詞”和える”を利用 ①”和える”を使った例文を考える ごまと和える ②”和える”と置き換えて意味の通じる語を考えて換言 ごまと和える → ごまと混ぜる ③”和える”と”混ぜる”は換言可能として辞書に追加 和える-混ぜる の対を取得
効率良く構築するため以下の場合換言しない ・より平易な表現が思いつかない →投げる、言う、話す など ・換言するときの必要語数が多い →一進一退する など ・意味が明確に分からない →笑み割れる、かがる など
品詞 換言対象語数 換言対作成数 無記入数 動詞 3,608語 3,206語 481語 サ変名詞 5,627語
4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 →およそ13,000語の単語を換言して 約10,000語の換言対を得られた
・無記入としたものについて 換言困難と判断したものがおおよそ3分の1 理解できない換言対象語がおおよそ3分の2となった →無記入の妥当性や理解できないものへの対策 今回構築した辞書を用いて換言出来るようになった →実際に換言を行った結果を考察し、 →辞書に反映させることで辞書の質を向上させる
ご清聴ありがとうございました。
・多義性がある語の換言 複数文脈に使われる可能性のある語を換言する場合 それぞれについて換言を行う。 例:仰ぐの場合 空を仰ぐ → 空を見る 師匠を仰ぐ → 師匠を尊敬する
指示を仰ぐ → 指示を求める この場合、仰ぐの候補は3つ全て追加することになる
・格変化を伴う換言 換言する際に格関係を修正する必要がある場合がある 例:背く 上司に背く → 上司に裏切る →不適切 上司に背く → 上司を裏切る
→適切 この場合「に背く」を「を裏切る」へと換言することになる
・慣用的表現 複数形態素の一部に換言する語が含まれている 例:入れる ギターを手に入れる →入れる単体での換言は不可 →ギターを得るへの換言は可 この場合、手に入れるはまとめて得ると換言する