Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EmoWordNet: Automatic Expansion of Emotion Lexi...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuto Kamiwaki
July 25, 2018
Research
0
110
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet
2018/07/26文献紹介の発表内容
Yuto Kamiwaki
July 25, 2018
Tweet
Share
More Decks by Yuto Kamiwaki
See All by Yuto Kamiwaki
Emo2Vec: Learning Generalized Emotion Representation by Multi-task Training
yuto_kamiwaki
0
120
Modeling Naive Psychology of Characters in Simple Commonsense Stories
yuto_kamiwaki
1
220
Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
yuto_kamiwaki
0
120
Epita at SemEval-2018 Task 1: Sentiment Analysis Using Transfer Learning Approach
yuto_kamiwaki
0
140
Tensor Fusion Network for Multimodal Sentiment Analysis
yuto_kamiwaki
0
280
Sentiment Analysis: It’s Complicated!
yuto_kamiwaki
0
88
ADAPT at IJCNLP-2017 Task 4: A Multinomial Naive Bayes Classification Approach for Customer Feedback Analysis task
yuto_kamiwaki
0
180
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION
yuto_kamiwaki
0
160
BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs
yuto_kamiwaki
0
260
Other Decks in Research
See All in Research
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
260
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
980
姫路市 -都市OSの「再実装」-
hopin
0
1.7k
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
410
Collective Predictive Coding and World Models in LLMs: A System 0/1/2/3 Perspective on Hierarchical Physical AI (IEEE SII 2026 Plenary Talk)
tanichu
1
320
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
990
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
820
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
160
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
180
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
300
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
140
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
530
Featured
See All Featured
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
How Software Deployment tools have changed in the past 20 years
geshan
0
33k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
310
A designer walks into a library…
pauljervisheath
210
24k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Raft: Consensus for Rubyists
vanstee
141
7.4k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
130
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
130
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.2k
sira's awesome portfolio website redesign presentation
elsirapls
0
200
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
260
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2k
Transcript
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet 長岡技術科学大学
自然言語処理研究室 上脇優人 Gilbert Badaro,Hussein Jundi,Harzem Hajj, Wassim El-Hajj Lexical and Computational Semantics(*SEM), 2018,pp86-93 7月文献紹介
Abstract •過去10年間,テキストから感情極性を抽出する ために多くの研究がされている. •最近は,テキストから感情認識もできるように なって来ている. •英語のWordNetを活用して,既存の感情辞書 DepecheMoodを拡張し,EmoWordNet(以下, EWN)を構築するといった内容. •語数は,67000語.(DepecheMoodの約1.8倍) 2
Introduction •SNSのユーザーが増えたことによって,大量の 意見・感情の含まれたテキストが使えるように なった. •感情辞書は,感情分類モデルの精度向上に寄与 している. •感情は,通常,「ポジティブ・ネガティブ・ニ ュートラル」の3つのラベルで表される. • Ekmanの感情分類(Ekman
1992)(幸福・悲しみ・ 恐怖・怒り・驚き・嫌悪感)やPlutchikのモデルに は,Ekmanの感情分類に加えて,信頼と期待が含ま れている. 3
Introduction •英語で大規模な感情辞書を作成する研究は多く あったが,既存の感情辞書のサイズは,小さい ままである. •Example: • 英語最大の感情辞書:DepecheMood • (Staiano and
Guerini 2014),約37000語 • SentiWordNet(SWN) • (Esuli and Sebastiani 2007;Baccianella et al 2010) • EWN(Fellbaum 1998)を使用して半自動的に生成された 英文の語彙レキシコンには「Positive・Negative・ Objective」の3つの感情が付与された約150000語が含ま れている. 4
Introduction •本研究は,EWNで利用可能なシソーラスを用い て,既存の感情辞書であるDepecheMoodの適 用範囲を拡大することに焦点を当てる. •DepecheMoodは,公開されている最大の感情 辞書の1つであり,その用語はEWNと整合してい る. •従って,DepecheMoodを拡張する. 5
Approach •DepecheMoodは,それぞれのエントリに8つの 感情ラベル(afraid・amused・angry・ annoyed・don’t care・happy・inspired ・sad)のスコア,POSタグと共に37771の見出 しから構成されている. •DepecheMoodには,スコア表現の3つのバリエ ーションが存在する. •
今回は,正規化スコアを用いたバリエーションを選 択. 6
7
Dataset & Coverage •SemEval 2007 task on Affective text(Strapparava and
Mihalcea, 2007) •データセットは,「anger,disgust,fear, joy,sadness,surprise」の6つの感情が 付与された1000の新しい見出しで構成されてい る. •(Staiano and Guerini,2014)の感情マッ ピングを考慮. • Fear → Afraid,Anger → Angry,Joy → Happy, Sadness → Sad,Surprise → Inspired. 8
Dataset & Coverage •カバレッジを計算するために,Python NLTKパッケ ージで入手可能なWordNet lemmatizerを使ってニ ュースheadlinesの見出し語化を行った. •名詞,動詞,形容詞,副詞とは異なるPOSタグを含む すべての単語を除外した.
•EmoWordNetは68.6%のカバレッジを達成し, DepecheMoodは67.1%のカバレッジを達成した. •カバレッジの増加が予想されたが,データセットのサ イズが比較的小さいため,増加は約1.5%に過ぎなか った。 9
Regression and Classification Results •DepecheMoodを評価するために提示されたアプロー チと同様のアプローチに従った. •前処理として,最初にPython NLTKパッケージで利 用可能なWordNet lemmatizerを使ってheadline
の見出し語化をした. •見出し語化後にnグラム(n = 3まで)を調べることで, EmoWordNetで利用可能な複数単語の語句を取得し た. •次に,名詞,動詞,形容詞,副詞の4つのPOSタグの いずれにも属していない用語をすべて削除した. 10
Regression and Classification Results •特徴量計算では,EmoWordNetとSemEvalデー タセットで重なる5つの感情ラベルの感情スコ アの合計と平均の2つのバリエーションを検討 した. •平均のスコアを用いるほうが,両方のデータの 合計スコアを使用するよりも優れたパフォーマ
ンスを発揮することが分かった. 11
12
13
14
15
Conclusion and Future Work • EmoWordNet(大規模な感情辞書)を製作した.EmoWordNetは,約 67000のEWNの単語と58000のEWN synsetと8つの感情スコアで 構成されている. •
EmoWordNetは,EWNとDepecheMoodを使用した意味拡張アプロ ーチを適用することによって自動的に構築した. • EmoWordNetは,既存の感情辞書より優れており,より優れた語彙 カバレッジを持っている. • 将来的には,より大きなデータセットでEmoWordNetのパフォーマ ンスを評価し,認識モデルの精度を向上させたい. • EmoWordNetはhttp://oma-project.comに公開されている. 16