Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書の構築
Search
自然言語処理研究室
March 31, 2013
Research
0
110
用言等換言辞書の構築
吉倉 孝太郎. 用言等換言辞書の構築. 長岡技術科学大学課題研究報告書. (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
520
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
150
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
960
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
270
Off-Policy Evaluation and Learning for Matching Markets
yudai00
0
110
The mathematics of transformers
gpeyre
0
130
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
140
【NICOGRAPH2025】Photographic Conviviality: ボディペイント・ワークショップによる 同時的かつ共生的な写真体験
toremolo72
0
200
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
200
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2k
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
440
第66回コンピュータビジョン勉強会@関東 Epona: Autoregressive Diffusion World Model for Autonomous Driving
kentosasaki
0
490
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
190
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities
satai
3
650
Featured
See All Featured
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.5k
How to Think Like a Performance Engineer
csswizardry
28
2.5k
Fireside Chat
paigeccino
42
3.8k
Prompt Engineering for Job Search
mfonobong
0
190
How STYLIGHT went responsive
nonsquared
100
6k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
53k
We Have a Design System, Now What?
morganepeng
55
8k
[SF Ruby Conf 2025] Rails X
palkan
2
830
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
Transcript
電気系 山本研究室 09319689 吉倉 孝太郎
換言:ある言語表現を別の言語表現に変換する処理 犬と散歩する → 犬と歩く 散歩すると歩くは換言可能な対である このような換言可能な対を集めることで ・文章の平易化 ・語彙の制限による処理精度の向上
・シソーラス(上位下位関係を使って換言) ・国語辞書の語釈文 などを用いて換言処理を行なっている →これらの換言が人間の感覚に沿った換言 となっているかどうか検討されていない
人間の感覚に沿った平易な換言を行いたい →現状、人間の感覚に沿った換言を行うための →言語資源は存在しない →本研究では人間の感覚に沿って平易に →換言することの出来る言語資源を構築する
・換言対象語は形態素解析器JUMANから抽出 ・換言対象語の品詞は動詞、サ変名詞、形容詞、副詞 ・なるべく平易な表現に換言する ・換言にはシソーラスや国語辞書等は利用しない
換言の流れ:例として動詞”和える”を利用 ①”和える”を使った例文を考える ごまと和える ②”和える”と置き換えて意味の通じる語を考えて換言 ごまと和える → ごまと混ぜる ③”和える”と”混ぜる”は換言可能として辞書に追加 和える-混ぜる の対を取得
効率良く構築するため以下の場合換言しない ・より平易な表現が思いつかない →投げる、言う、話す など ・換言するときの必要語数が多い →一進一退する など ・意味が明確に分からない →笑み割れる、かがる など
品詞 換言対象語数 換言対作成数 無記入数 動詞 3,608語 3,206語 481語 サ変名詞 5,627語
4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 →およそ13,000語の単語を換言して 約10,000語の換言対を得られた
・無記入としたものについて 換言困難と判断したものがおおよそ3分の1 理解できない換言対象語がおおよそ3分の2となった →無記入の妥当性や理解できないものへの対策 今回構築した辞書を用いて換言出来るようになった →実際に換言を行った結果を考察し、 →辞書に反映させることで辞書の質を向上させる
ご清聴ありがとうございました。
・多義性がある語の換言 複数文脈に使われる可能性のある語を換言する場合 それぞれについて換言を行う。 例:仰ぐの場合 空を仰ぐ → 空を見る 師匠を仰ぐ → 師匠を尊敬する
指示を仰ぐ → 指示を求める この場合、仰ぐの候補は3つ全て追加することになる
・格変化を伴う換言 換言する際に格関係を修正する必要がある場合がある 例:背く 上司に背く → 上司に裏切る →不適切 上司に背く → 上司を裏切る
→適切 この場合「に背く」を「を裏切る」へと換言することになる
・慣用的表現 複数形態素の一部に換言する語が含まれている 例:入れる ギターを手に入れる →入れる単体での換言は不可 →ギターを得るへの換言は可 この場合、手に入れるはまとめて得ると換言する