Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EmoWordNet: Automatic Expansion of Emotion Lexi...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuto Kamiwaki
July 25, 2018
Research
0
110
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet
2018/07/26文献紹介の発表内容
Yuto Kamiwaki
July 25, 2018
Tweet
Share
More Decks by Yuto Kamiwaki
See All by Yuto Kamiwaki
Emo2Vec: Learning Generalized Emotion Representation by Multi-task Training
yuto_kamiwaki
0
120
Modeling Naive Psychology of Characters in Simple Commonsense Stories
yuto_kamiwaki
1
220
Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
yuto_kamiwaki
0
110
Epita at SemEval-2018 Task 1: Sentiment Analysis Using Transfer Learning Approach
yuto_kamiwaki
0
140
Tensor Fusion Network for Multimodal Sentiment Analysis
yuto_kamiwaki
0
270
Sentiment Analysis: It’s Complicated!
yuto_kamiwaki
0
86
ADAPT at IJCNLP-2017 Task 4: A Multinomial Naive Bayes Classification Approach for Customer Feedback Analysis task
yuto_kamiwaki
0
180
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION
yuto_kamiwaki
0
160
BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs
yuto_kamiwaki
0
250
Other Decks in Research
See All in Research
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
170
その推薦システムの評価指標、ユーザーの感覚とズレてるかも
kuri8ive
1
330
LLM-jp-3 and beyond: Training Large Language Models
odashi
1
780
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
130
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp
1
480
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1.4k
LLM-Assisted Semantic Guidance for Sparsely Annotated Remote Sensing Object Detection
satai
3
540
2026 東京科学大 情報通信系 研究室紹介 (すずかけ台)
icttitech
0
330
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
200
データサイエンティストの業務変化
datascientistsociety
PRO
0
270
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
150
SkySense V2: A Unified Foundation Model for Multi-modal Remote Sensing
satai
3
560
Featured
See All Featured
Leo the Paperboy
mayatellez
4
1.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
270
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.3k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Done Done
chrislema
186
16k
The SEO Collaboration Effect
kristinabergwall1
0
380
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
460
How to Talk to Developers About Accessibility
jct
2
140
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
240
Transcript
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet 長岡技術科学大学
自然言語処理研究室 上脇優人 Gilbert Badaro,Hussein Jundi,Harzem Hajj, Wassim El-Hajj Lexical and Computational Semantics(*SEM), 2018,pp86-93 7月文献紹介
Abstract •過去10年間,テキストから感情極性を抽出する ために多くの研究がされている. •最近は,テキストから感情認識もできるように なって来ている. •英語のWordNetを活用して,既存の感情辞書 DepecheMoodを拡張し,EmoWordNet(以下, EWN)を構築するといった内容. •語数は,67000語.(DepecheMoodの約1.8倍) 2
Introduction •SNSのユーザーが増えたことによって,大量の 意見・感情の含まれたテキストが使えるように なった. •感情辞書は,感情分類モデルの精度向上に寄与 している. •感情は,通常,「ポジティブ・ネガティブ・ニ ュートラル」の3つのラベルで表される. • Ekmanの感情分類(Ekman
1992)(幸福・悲しみ・ 恐怖・怒り・驚き・嫌悪感)やPlutchikのモデルに は,Ekmanの感情分類に加えて,信頼と期待が含ま れている. 3
Introduction •英語で大規模な感情辞書を作成する研究は多く あったが,既存の感情辞書のサイズは,小さい ままである. •Example: • 英語最大の感情辞書:DepecheMood • (Staiano and
Guerini 2014),約37000語 • SentiWordNet(SWN) • (Esuli and Sebastiani 2007;Baccianella et al 2010) • EWN(Fellbaum 1998)を使用して半自動的に生成された 英文の語彙レキシコンには「Positive・Negative・ Objective」の3つの感情が付与された約150000語が含ま れている. 4
Introduction •本研究は,EWNで利用可能なシソーラスを用い て,既存の感情辞書であるDepecheMoodの適 用範囲を拡大することに焦点を当てる. •DepecheMoodは,公開されている最大の感情 辞書の1つであり,その用語はEWNと整合してい る. •従って,DepecheMoodを拡張する. 5
Approach •DepecheMoodは,それぞれのエントリに8つの 感情ラベル(afraid・amused・angry・ annoyed・don’t care・happy・inspired ・sad)のスコア,POSタグと共に37771の見出 しから構成されている. •DepecheMoodには,スコア表現の3つのバリエ ーションが存在する. •
今回は,正規化スコアを用いたバリエーションを選 択. 6
7
Dataset & Coverage •SemEval 2007 task on Affective text(Strapparava and
Mihalcea, 2007) •データセットは,「anger,disgust,fear, joy,sadness,surprise」の6つの感情が 付与された1000の新しい見出しで構成されてい る. •(Staiano and Guerini,2014)の感情マッ ピングを考慮. • Fear → Afraid,Anger → Angry,Joy → Happy, Sadness → Sad,Surprise → Inspired. 8
Dataset & Coverage •カバレッジを計算するために,Python NLTKパッケ ージで入手可能なWordNet lemmatizerを使ってニ ュースheadlinesの見出し語化を行った. •名詞,動詞,形容詞,副詞とは異なるPOSタグを含む すべての単語を除外した.
•EmoWordNetは68.6%のカバレッジを達成し, DepecheMoodは67.1%のカバレッジを達成した. •カバレッジの増加が予想されたが,データセットのサ イズが比較的小さいため,増加は約1.5%に過ぎなか った。 9
Regression and Classification Results •DepecheMoodを評価するために提示されたアプロー チと同様のアプローチに従った. •前処理として,最初にPython NLTKパッケージで利 用可能なWordNet lemmatizerを使ってheadline
の見出し語化をした. •見出し語化後にnグラム(n = 3まで)を調べることで, EmoWordNetで利用可能な複数単語の語句を取得し た. •次に,名詞,動詞,形容詞,副詞の4つのPOSタグの いずれにも属していない用語をすべて削除した. 10
Regression and Classification Results •特徴量計算では,EmoWordNetとSemEvalデー タセットで重なる5つの感情ラベルの感情スコ アの合計と平均の2つのバリエーションを検討 した. •平均のスコアを用いるほうが,両方のデータの 合計スコアを使用するよりも優れたパフォーマ
ンスを発揮することが分かった. 11
12
13
14
15
Conclusion and Future Work • EmoWordNet(大規模な感情辞書)を製作した.EmoWordNetは,約 67000のEWNの単語と58000のEWN synsetと8つの感情スコアで 構成されている. •
EmoWordNetは,EWNとDepecheMoodを使用した意味拡張アプロ ーチを適用することによって自動的に構築した. • EmoWordNetは,既存の感情辞書より優れており,より優れた語彙 カバレッジを持っている. • 将来的には,より大きなデータセットでEmoWordNetのパフォーマ ンスを評価し,認識モデルの精度を向上させたい. • EmoWordNetはhttp://oma-project.comに公開されている. 16