Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EmoWordNet: Automatic Expansion of Emotion Lexi...
Search
Yuto Kamiwaki
July 25, 2018
Research
0
110
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet
2018/07/26文献紹介の発表内容
Yuto Kamiwaki
July 25, 2018
Tweet
Share
More Decks by Yuto Kamiwaki
See All by Yuto Kamiwaki
Emo2Vec: Learning Generalized Emotion Representation by Multi-task Training
yuto_kamiwaki
0
110
Modeling Naive Psychology of Characters in Simple Commonsense Stories
yuto_kamiwaki
1
210
Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
yuto_kamiwaki
0
110
Epita at SemEval-2018 Task 1: Sentiment Analysis Using Transfer Learning Approach
yuto_kamiwaki
0
130
Tensor Fusion Network for Multimodal Sentiment Analysis
yuto_kamiwaki
0
250
Sentiment Analysis: It’s Complicated!
yuto_kamiwaki
0
79
ADAPT at IJCNLP-2017 Task 4: A Multinomial Naive Bayes Classification Approach for Customer Feedback Analysis task
yuto_kamiwaki
0
150
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION
yuto_kamiwaki
0
150
BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs
yuto_kamiwaki
0
250
Other Decks in Research
See All in Research
ウッドスタックチャン:木材を用いた小型エージェントロボットの開発と印象評価 / ec75-sato
yumulab
1
420
When Submarine Cables Go Dark: Examining the Web Services Resilience Amid Global Internet Disruptions
irvin
0
230
近似動的計画入門
mickey_kubo
4
980
Towards a More Efficient Reasoning LLM: AIMO2 Solution Summary and Introduction to Fast-Math Models
analokmaus
2
290
EarthMarker: A Visual Prompting Multimodal Large Language Model for Remote Sensing
satai
3
350
CSP: Self-Supervised Contrastive Spatial Pre-Training for Geospatial-Visual Representations
satai
3
220
Agentic AIとMCPを利用したサービス作成入門
mickey_kubo
0
280
SSII2025 [TS2] リモートセンシング画像処理の最前線
ssii
PRO
7
2.9k
時系列データに対する解釈可能な 決定木クラスタリング
mickey_kubo
2
740
プロシェアリング白書2025_PROSHARING_REPORT_2025
circulation
1
890
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究
laysakura
0
1.6k
Computational OT #1 - Monge and Kantorovitch
gpeyre
0
190
Featured
See All Featured
Scaling GitHub
holman
460
140k
Testing 201, or: Great Expectations
jmmastey
43
7.6k
Embracing the Ebb and Flow
colly
86
4.7k
The Cult of Friendly URLs
andyhume
79
6.5k
Building Adaptive Systems
keathley
43
2.7k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Faster Mobile Websites
deanohume
307
31k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
970
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.4k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.3k
Code Review Best Practice
trishagee
69
18k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.9k
Transcript
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet 長岡技術科学大学
自然言語処理研究室 上脇優人 Gilbert Badaro,Hussein Jundi,Harzem Hajj, Wassim El-Hajj Lexical and Computational Semantics(*SEM), 2018,pp86-93 7月文献紹介
Abstract •過去10年間,テキストから感情極性を抽出する ために多くの研究がされている. •最近は,テキストから感情認識もできるように なって来ている. •英語のWordNetを活用して,既存の感情辞書 DepecheMoodを拡張し,EmoWordNet(以下, EWN)を構築するといった内容. •語数は,67000語.(DepecheMoodの約1.8倍) 2
Introduction •SNSのユーザーが増えたことによって,大量の 意見・感情の含まれたテキストが使えるように なった. •感情辞書は,感情分類モデルの精度向上に寄与 している. •感情は,通常,「ポジティブ・ネガティブ・ニ ュートラル」の3つのラベルで表される. • Ekmanの感情分類(Ekman
1992)(幸福・悲しみ・ 恐怖・怒り・驚き・嫌悪感)やPlutchikのモデルに は,Ekmanの感情分類に加えて,信頼と期待が含ま れている. 3
Introduction •英語で大規模な感情辞書を作成する研究は多く あったが,既存の感情辞書のサイズは,小さい ままである. •Example: • 英語最大の感情辞書:DepecheMood • (Staiano and
Guerini 2014),約37000語 • SentiWordNet(SWN) • (Esuli and Sebastiani 2007;Baccianella et al 2010) • EWN(Fellbaum 1998)を使用して半自動的に生成された 英文の語彙レキシコンには「Positive・Negative・ Objective」の3つの感情が付与された約150000語が含ま れている. 4
Introduction •本研究は,EWNで利用可能なシソーラスを用い て,既存の感情辞書であるDepecheMoodの適 用範囲を拡大することに焦点を当てる. •DepecheMoodは,公開されている最大の感情 辞書の1つであり,その用語はEWNと整合してい る. •従って,DepecheMoodを拡張する. 5
Approach •DepecheMoodは,それぞれのエントリに8つの 感情ラベル(afraid・amused・angry・ annoyed・don’t care・happy・inspired ・sad)のスコア,POSタグと共に37771の見出 しから構成されている. •DepecheMoodには,スコア表現の3つのバリエ ーションが存在する. •
今回は,正規化スコアを用いたバリエーションを選 択. 6
7
Dataset & Coverage •SemEval 2007 task on Affective text(Strapparava and
Mihalcea, 2007) •データセットは,「anger,disgust,fear, joy,sadness,surprise」の6つの感情が 付与された1000の新しい見出しで構成されてい る. •(Staiano and Guerini,2014)の感情マッ ピングを考慮. • Fear → Afraid,Anger → Angry,Joy → Happy, Sadness → Sad,Surprise → Inspired. 8
Dataset & Coverage •カバレッジを計算するために,Python NLTKパッケ ージで入手可能なWordNet lemmatizerを使ってニ ュースheadlinesの見出し語化を行った. •名詞,動詞,形容詞,副詞とは異なるPOSタグを含む すべての単語を除外した.
•EmoWordNetは68.6%のカバレッジを達成し, DepecheMoodは67.1%のカバレッジを達成した. •カバレッジの増加が予想されたが,データセットのサ イズが比較的小さいため,増加は約1.5%に過ぎなか った。 9
Regression and Classification Results •DepecheMoodを評価するために提示されたアプロー チと同様のアプローチに従った. •前処理として,最初にPython NLTKパッケージで利 用可能なWordNet lemmatizerを使ってheadline
の見出し語化をした. •見出し語化後にnグラム(n = 3まで)を調べることで, EmoWordNetで利用可能な複数単語の語句を取得し た. •次に,名詞,動詞,形容詞,副詞の4つのPOSタグの いずれにも属していない用語をすべて削除した. 10
Regression and Classification Results •特徴量計算では,EmoWordNetとSemEvalデー タセットで重なる5つの感情ラベルの感情スコ アの合計と平均の2つのバリエーションを検討 した. •平均のスコアを用いるほうが,両方のデータの 合計スコアを使用するよりも優れたパフォーマ
ンスを発揮することが分かった. 11
12
13
14
15
Conclusion and Future Work • EmoWordNet(大規模な感情辞書)を製作した.EmoWordNetは,約 67000のEWNの単語と58000のEWN synsetと8つの感情スコアで 構成されている. •
EmoWordNetは,EWNとDepecheMoodを使用した意味拡張アプロ ーチを適用することによって自動的に構築した. • EmoWordNetは,既存の感情辞書より優れており,より優れた語彙 カバレッジを持っている. • 将来的には,より大きなデータセットでEmoWordNetのパフォーマ ンスを評価し,認識モデルの精度を向上させたい. • EmoWordNetはhttp://oma-project.comに公開されている. 16