Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書の構築
Search
自然言語処理研究室
March 31, 2013
Research
0
61
用言等換言辞書の構築
吉倉 孝太郎. 用言等換言辞書の構築. 長岡技術科学大学課題研究報告書. (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
330
データサイエンス13_解析.pdf
jnlp
0
380
データサイエンス12_分類.pdf
jnlp
0
290
データサイエンス11_前処理.pdf
jnlp
0
400
Recurrent neural network based language model
jnlp
0
100
自然言語処理研究室 研究概要(2012年)
jnlp
0
100
自然言語処理研究室 研究概要(2013年)
jnlp
0
69
自然言語処理研究室 研究概要(2014年)
jnlp
0
65
自然言語処理研究室 研究概要(2015年)
jnlp
0
120
Other Decks in Research
See All in Research
Accurate Method and Variable Tracking in Commit History
tsantalis
0
250
センサデータを活用した 肌質改善への支援システムに関する研究
comfortdesignlab
0
150
Discovering Universal Geometry in Embeddings with ICA
momoseoyama
1
340
[Human-AI Decision Making勉強会] 説明の更新はユーザにどのような影響をもたらすか
okoso
1
180
研究効率化Tips_2024 / Research Efficiency Tips 2024
ryo_nakamura
5
2.8k
Prompt Tuning から Fine Tuning への移行時期推定
icoxfog417
17
7k
People Driven Transformation / 人が起点の、社会の変え方
dmattsun
0
150
Sosiaalisen median katsaus 02/2024
hponka
0
2.6k
脳卒中患者・家族からみた循環器病対策推進基本計画の進捗に関する調査
japanstrokeassociation
0
530
クリック率を最大化しない推薦システム
joisino
41
14k
Breaking Tradeoffs: Extremely Scalable Multi-Agent Pathfinding Algorithms
kei18
0
140
論文紹介 DISN: Deep Implicit Surface Network for High quality Single-view 3D Reconstruction / DISN: Deep Implicit Surface Network for High quality Single-view 3D Reconstruction
nttcom
0
120
Featured
See All Featured
The Language of Interfaces
destraynor
151
23k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
241
1.2M
Designing the Hi-DPI Web
ddemaree
276
33k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
227
16k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
221
21k
From Idea to $5000 a Month in 5 Months
shpigford
377
45k
The Cult of Friendly URLs
andyhume
74
5.7k
How STYLIGHT went responsive
nonsquared
92
4.8k
Embracing the Ebb and Flow
colly
80
4.1k
Building Effective Engineering Teams - LeadDev
addyosmani
28
1.8k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
104
6.6k
A better future with KSS
kneath
231
16k
Transcript
電気系 山本研究室 09319689 吉倉 孝太郎
換言:ある言語表現を別の言語表現に変換する処理 犬と散歩する → 犬と歩く 散歩すると歩くは換言可能な対である このような換言可能な対を集めることで ・文章の平易化 ・語彙の制限による処理精度の向上
・シソーラス(上位下位関係を使って換言) ・国語辞書の語釈文 などを用いて換言処理を行なっている →これらの換言が人間の感覚に沿った換言 となっているかどうか検討されていない
人間の感覚に沿った平易な換言を行いたい →現状、人間の感覚に沿った換言を行うための →言語資源は存在しない →本研究では人間の感覚に沿って平易に →換言することの出来る言語資源を構築する
・換言対象語は形態素解析器JUMANから抽出 ・換言対象語の品詞は動詞、サ変名詞、形容詞、副詞 ・なるべく平易な表現に換言する ・換言にはシソーラスや国語辞書等は利用しない
換言の流れ:例として動詞”和える”を利用 ①”和える”を使った例文を考える ごまと和える ②”和える”と置き換えて意味の通じる語を考えて換言 ごまと和える → ごまと混ぜる ③”和える”と”混ぜる”は換言可能として辞書に追加 和える-混ぜる の対を取得
効率良く構築するため以下の場合換言しない ・より平易な表現が思いつかない →投げる、言う、話す など ・換言するときの必要語数が多い →一進一退する など ・意味が明確に分からない →笑み割れる、かがる など
品詞 換言対象語数 換言対作成数 無記入数 動詞 3,608語 3,206語 481語 サ変名詞 5,627語
4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 →およそ13,000語の単語を換言して 約10,000語の換言対を得られた
・無記入としたものについて 換言困難と判断したものがおおよそ3分の1 理解できない換言対象語がおおよそ3分の2となった →無記入の妥当性や理解できないものへの対策 今回構築した辞書を用いて換言出来るようになった →実際に換言を行った結果を考察し、 →辞書に反映させることで辞書の質を向上させる
ご清聴ありがとうございました。
・多義性がある語の換言 複数文脈に使われる可能性のある語を換言する場合 それぞれについて換言を行う。 例:仰ぐの場合 空を仰ぐ → 空を見る 師匠を仰ぐ → 師匠を尊敬する
指示を仰ぐ → 指示を求める この場合、仰ぐの候補は3つ全て追加することになる
・格変化を伴う換言 換言する際に格関係を修正する必要がある場合がある 例:背く 上司に背く → 上司に裏切る →不適切 上司に背く → 上司を裏切る
→適切 この場合「に背く」を「を裏切る」へと換言することになる
・慣用的表現 複数形態素の一部に換言する語が含まれている 例:入れる ギターを手に入れる →入れる単体での換言は不可 →ギターを得るへの換言は可 この場合、手に入れるはまとめて得ると換言する