Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
シソーラスを組み込んだ意味解析システム
Search
katsutan
April 27, 2017
Technology
0
240
シソーラスを組み込んだ意味解析システム
文献紹介
長岡技術科学大学 自然言語処理研究室
勝田哲弘
katsutan
April 27, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
240
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
220
Simple task-specific bilingual word embeddings
katsutan
0
210
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
270
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
220
Improving Word Embeddings Using Kernel PCA
katsutan
0
230
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
320
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
270
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
300
Other Decks in Technology
See All in Technology
Claude Code 2026年 最新アップデート
oikon48
13
10k
Yahoo!ショッピングのレコメンデーション・システムにおけるML実践の一例
lycorptech_jp
PRO
1
210
2026年もソフトウェアサプライチェーンのリスクに立ち向かうために / Product Security Square #3
flatt_security
1
520
内製AIチャットボットで学んだDatadog LLM Observability活用術
mkdev10
0
120
AWS CDK「読めるけど書けない」を脱却するファーストステップ
smt7174
3
140
わからなくて良いなら、わからなきゃだめなの?
kotaoue
1
360
組織全体で実現する標準監視設計
yuobayashi
3
490
AWSの資格って役に立つの?
tk3fftk
2
340
Go標準パッケージのI/O処理をながめる
matumoto
0
210
【Oracle Cloud ウェビナー】【入門編】はじめてのOracle AI Data Platform - AIのためのデータ準備&自社用AIエージェントをワンストップで実現
oracle4engineer
PRO
1
140
楽しく学ぼう!ネットワーク入門
shotashiratori
1
400
ランサムウエア対策してますか?やられた時の対策は本当にできてますか?AWSでのリスク分析と対応フローの泥臭いお話。
hootaki
0
140
Featured
See All Featured
For a Future-Friendly Web
brad_frost
183
10k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
130
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
140
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
320
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
The Curious Case for Waylosing
cassininazir
0
270
Making Projects Easy
brettharned
120
6.6k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
140
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
640
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
Transcript
文献紹介: シソーラスを組み込んだ意味解析シ ステム 国分 芳宏, 梅北 浩二, 松下 栄一, 末岡
隆史 自然言語処理 Vol. 17 (2010) No. 4 P 4_43-4_57 長岡技術科学大学 自然言語処理研究室 学部4年 勝田哲弘 2017/4/28 図、表などは論文中から引用しています。
概要 • 用語の異なり、構文構造の異なりに対処し、解 析精度を向上させる • 対策としては、シソーラスを用いて用語間の意 味的な距離を決定する ▫ 用語の標準化や係り受けの正規化、省略された主 語の復元、文節意図を付与する
• 0.9ポイントの向上
構文構造の決定 • シソーラスを用いて用語同士の意味的な距離の 近いところに係るという方式
構文構造の決定 <P>は並列の意味
意味的な距離の定義 • 例 ネットで -調べる -行く 意味的な距離 1 ∞
意味的な距離の定義 • 未定義のものは関係ごとの意味的な距離を加算 する 狭義語のさらに狭義語は1+1で2と定義される • 同じ言葉でも異なる意味のものは別の言葉とし て管理する
係り受けデータの整理 • シソーラスを用いて用語の標準化
係り受けデータの整理 • 係り受けの正規化 ▫ 限定用法を叙述用法に統一 例 青、い、リンゴ → リンゴ、が、青、い •
間に挟む助詞は4種類に限定
情報の付与 • 文節意図 ▫ 係り受けの語幹までで区切りそれ以降の「付属語 の並び」を管理 • 例 お酒を飲 んでください
係り受け 付属語の並び
情報の付与 このシステムでは130万 行の解析辞書を使用
情報の付与
主語の推定 • 待遇表現による推定 ▫ 謙譲語が使われている動詞は一人称 ▫ 尊敬語は二人称又は三人称 • 文節意図による推定
辞書-シソーラス
解析辞書 • 各用語に付与されている情報 • 名詞の意味
解析辞書 • 用言()内は活用語尾
解析辞書 • 動詞の性質 • 付属語の並び
実験 • Yahoo!知恵袋データ2004年4月の質問記事 (5957記事、15883文)を用いて、 cabochaとの解析精度を比較 • また、シソーラスをシステムに組み込んだ場合 とそうでない場合を比べる
結果 • 13.8ポイント上回っている • シソーラスの有無では全体の15883文に対 して0.9%向上している
結果 • 成功例 「音楽がいつまでたっても始まりません」 • 失敗例 「警察の方に話がいっているかわからない」
まとめ • シソーラスによる意味的な距離を考慮すると、 0.9%向上した • 係り受け語の規模が小さかったため対応が取れ なかった • 会話体の文章を扱うため、用語をうまくまとめ られなかった