Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書の構築
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
自然言語処理研究室
March 31, 2013
Research
120
0
Share
用言等換言辞書の構築
吉倉 孝太郎. 用言等換言辞書の構築. 長岡技術科学大学課題研究報告書. (2013.3)
自然言語処理研究室
March 31, 2013
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
160
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
2026年1月の生成AI領域の重要リリース&トピック解説
kajikent
0
980
[BlackHatAsia2026] Hidden Telemetry: Uncovering TraceLogging ETW Providers You're Not Using (Yet)
asuna_jp
1
400
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
2.9k
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
490
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
160
Model Discovery and Graph Simulation: A Lightweight Gateway to Chaos Engineering
anatolykr
0
150
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
860
LOSの検討(λ Kansai 2026 in Winter)
motopu
0
120
データセンター事業者を取り巻く近年の状況とその中での研究開発動向、テストベッドへの貢献の可能性
kikuzo
1
120
さくらインターネット研究所テックトーク2026春、研究開発Gr.25年度成果26年度方針
kikuzo
0
130
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
1.1k
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
570
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
820
Building Applications with DynamoDB
mza
96
7k
Odyssey Design
rkendrick25
PRO
2
610
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
500
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
530
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
130
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
100
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
1
28
The untapped power of vector embeddings
frankvandijk
2
1.7k
WCS-LA-2024
lcolladotor
0
570
Accessibility Awareness
sabderemane
1
110
Transcript
電気系 山本研究室 09319689 吉倉 孝太郎
換言:ある言語表現を別の言語表現に変換する処理 犬と散歩する → 犬と歩く 散歩すると歩くは換言可能な対である このような換言可能な対を集めることで ・文章の平易化 ・語彙の制限による処理精度の向上
・シソーラス(上位下位関係を使って換言) ・国語辞書の語釈文 などを用いて換言処理を行なっている →これらの換言が人間の感覚に沿った換言 となっているかどうか検討されていない
人間の感覚に沿った平易な換言を行いたい →現状、人間の感覚に沿った換言を行うための →言語資源は存在しない →本研究では人間の感覚に沿って平易に →換言することの出来る言語資源を構築する
・換言対象語は形態素解析器JUMANから抽出 ・換言対象語の品詞は動詞、サ変名詞、形容詞、副詞 ・なるべく平易な表現に換言する ・換言にはシソーラスや国語辞書等は利用しない
換言の流れ:例として動詞”和える”を利用 ①”和える”を使った例文を考える ごまと和える ②”和える”と置き換えて意味の通じる語を考えて換言 ごまと和える → ごまと混ぜる ③”和える”と”混ぜる”は換言可能として辞書に追加 和える-混ぜる の対を取得
効率良く構築するため以下の場合換言しない ・より平易な表現が思いつかない →投げる、言う、話す など ・換言するときの必要語数が多い →一進一退する など ・意味が明確に分からない →笑み割れる、かがる など
品詞 換言対象語数 換言対作成数 無記入数 動詞 3,608語 3,206語 481語 サ変名詞 5,627語
4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 →およそ13,000語の単語を換言して 約10,000語の換言対を得られた
・無記入としたものについて 換言困難と判断したものがおおよそ3分の1 理解できない換言対象語がおおよそ3分の2となった →無記入の妥当性や理解できないものへの対策 今回構築した辞書を用いて換言出来るようになった →実際に換言を行った結果を考察し、 →辞書に反映させることで辞書の質を向上させる
ご清聴ありがとうございました。
・多義性がある語の換言 複数文脈に使われる可能性のある語を換言する場合 それぞれについて換言を行う。 例:仰ぐの場合 空を仰ぐ → 空を見る 師匠を仰ぐ → 師匠を尊敬する
指示を仰ぐ → 指示を求める この場合、仰ぐの候補は3つ全て追加することになる
・格変化を伴う換言 換言する際に格関係を修正する必要がある場合がある 例:背く 上司に背く → 上司に裏切る →不適切 上司に背く → 上司を裏切る
→適切 この場合「に背く」を「を裏切る」へと換言することになる
・慣用的表現 複数形態素の一部に換言する語が含まれている 例:入れる ギターを手に入れる →入れる単体での換言は不可 →ギターを得るへの換言は可 この場合、手に入れるはまとめて得ると換言する