Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
シソーラスを組み込んだ意味解析システム
Search
katsutan
April 27, 2017
Technology
0
220
シソーラスを組み込んだ意味解析システム
文献紹介
長岡技術科学大学 自然言語処理研究室
勝田哲弘
katsutan
April 27, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
220
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
200
Simple task-specific bilingual word embeddings
katsutan
0
210
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
250
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
200
Improving Word Embeddings Using Kernel PCA
katsutan
0
210
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
310
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
250
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
290
Other Decks in Technology
See All in Technology
Automating Web Accessibility Testing with AI Agents
maminami373
0
1.3k
DevIO2025_継続的なサービス開発のための技術的意思決定のポイント / how-to-tech-decision-makaing-devio2025
nologyance
1
390
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.7k
Webアプリケーションにオブザーバビリティを実装するRust入門ガイド
nwiizo
7
830
5年目から始める Vue3 サイト改善 #frontendo
tacck
PRO
3
220
下手な強制、ダメ!絶対! 「ガードレール」を「檻」にさせない"ガバナンス"の取り方とは?
tsukaman
2
440
【初心者向け】ローカルLLMの色々な動かし方まとめ
aratako
7
3.5k
dbt開発 with Claude Codeのためのガードレール設計
10xinc
2
1.2k
初めてAWSを使うときのセキュリティ覚書〜初心者支部編〜
cmusudakeisuke
1
250
Rustから学ぶ 非同期処理の仕組み
skanehira
1
140
KotlinConf 2025_イベントレポート
sony
1
130
機械学習を扱うプラットフォーム開発と運用事例
lycorptech_jp
PRO
0
250
Featured
See All Featured
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
The Power of CSS Pseudo Elements
geoffreycrofte
77
6k
Become a Pro
speakerdeck
PRO
29
5.5k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.6k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The Language of Interfaces
destraynor
161
25k
Practical Orchestrator
shlominoach
190
11k
RailsConf 2023
tenderlove
30
1.2k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
131
19k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
61k
The Art of Programming - Codeland 2020
erikaheidi
56
13k
How STYLIGHT went responsive
nonsquared
100
5.8k
Transcript
文献紹介: シソーラスを組み込んだ意味解析シ ステム 国分 芳宏, 梅北 浩二, 松下 栄一, 末岡
隆史 自然言語処理 Vol. 17 (2010) No. 4 P 4_43-4_57 長岡技術科学大学 自然言語処理研究室 学部4年 勝田哲弘 2017/4/28 図、表などは論文中から引用しています。
概要 • 用語の異なり、構文構造の異なりに対処し、解 析精度を向上させる • 対策としては、シソーラスを用いて用語間の意 味的な距離を決定する ▫ 用語の標準化や係り受けの正規化、省略された主 語の復元、文節意図を付与する
• 0.9ポイントの向上
構文構造の決定 • シソーラスを用いて用語同士の意味的な距離の 近いところに係るという方式
構文構造の決定 <P>は並列の意味
意味的な距離の定義 • 例 ネットで -調べる -行く 意味的な距離 1 ∞
意味的な距離の定義 • 未定義のものは関係ごとの意味的な距離を加算 する 狭義語のさらに狭義語は1+1で2と定義される • 同じ言葉でも異なる意味のものは別の言葉とし て管理する
係り受けデータの整理 • シソーラスを用いて用語の標準化
係り受けデータの整理 • 係り受けの正規化 ▫ 限定用法を叙述用法に統一 例 青、い、リンゴ → リンゴ、が、青、い •
間に挟む助詞は4種類に限定
情報の付与 • 文節意図 ▫ 係り受けの語幹までで区切りそれ以降の「付属語 の並び」を管理 • 例 お酒を飲 んでください
係り受け 付属語の並び
情報の付与 このシステムでは130万 行の解析辞書を使用
情報の付与
主語の推定 • 待遇表現による推定 ▫ 謙譲語が使われている動詞は一人称 ▫ 尊敬語は二人称又は三人称 • 文節意図による推定
辞書-シソーラス
解析辞書 • 各用語に付与されている情報 • 名詞の意味
解析辞書 • 用言()内は活用語尾
解析辞書 • 動詞の性質 • 付属語の並び
実験 • Yahoo!知恵袋データ2004年4月の質問記事 (5957記事、15883文)を用いて、 cabochaとの解析精度を比較 • また、シソーラスをシステムに組み込んだ場合 とそうでない場合を比べる
結果 • 13.8ポイント上回っている • シソーラスの有無では全体の15883文に対 して0.9%向上している
結果 • 成功例 「音楽がいつまでたっても始まりません」 • 失敗例 「警察の方に話がいっているかわからない」
まとめ • シソーラスによる意味的な距離を考慮すると、 0.9%向上した • 係り受け語の規模が小さかったため対応が取れ なかった • 会話体の文章を扱うため、用語をうまくまとめ られなかった