Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EmoWordNet: Automatic Expansion of Emotion Lexi...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuto Kamiwaki
July 25, 2018
Research
0
110
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet
2018/07/26文献紹介の発表内容
Yuto Kamiwaki
July 25, 2018
Tweet
Share
More Decks by Yuto Kamiwaki
See All by Yuto Kamiwaki
Emo2Vec: Learning Generalized Emotion Representation by Multi-task Training
yuto_kamiwaki
0
120
Modeling Naive Psychology of Characters in Simple Commonsense Stories
yuto_kamiwaki
1
220
Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
yuto_kamiwaki
0
110
Epita at SemEval-2018 Task 1: Sentiment Analysis Using Transfer Learning Approach
yuto_kamiwaki
0
140
Tensor Fusion Network for Multimodal Sentiment Analysis
yuto_kamiwaki
0
270
Sentiment Analysis: It’s Complicated!
yuto_kamiwaki
0
86
ADAPT at IJCNLP-2017 Task 4: A Multinomial Naive Bayes Classification Approach for Customer Feedback Analysis task
yuto_kamiwaki
0
180
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION
yuto_kamiwaki
0
160
BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs
yuto_kamiwaki
0
250
Other Decks in Research
See All in Research
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
160
OWASP KansaiDAY 2025.09_文系OSINTハンズオン
owaspkansai
0
110
さまざまなAgent FrameworkとAIエージェントの評価
ymd65536
1
420
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
530
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
1.6k
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
190
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
140
地域丸ごとデイサービス「Go トレ」の紹介
smartfukushilab1
0
930
20251023_くまもと21の会例会_「車1割削減、渋滞半減、公共交通2倍」をめざして.pdf
trafficbrain
0
180
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
300
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
260
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
550
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.3k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
What's in a price? How to price your products and services
michaelherold
247
13k
Git: the NoSQL Database
bkeepers
PRO
432
66k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
270
GitHub's CSS Performance
jonrohan
1032
470k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
3.9k
Between Models and Reality
mayunak
1
200
Discover your Explorer Soul
emna__ayadi
2
1.1k
Facilitating Awesome Meetings
lara
57
6.8k
KATA
mclloyd
PRO
34
15k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
110
Transcript
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet 長岡技術科学大学
自然言語処理研究室 上脇優人 Gilbert Badaro,Hussein Jundi,Harzem Hajj, Wassim El-Hajj Lexical and Computational Semantics(*SEM), 2018,pp86-93 7月文献紹介
Abstract •過去10年間,テキストから感情極性を抽出する ために多くの研究がされている. •最近は,テキストから感情認識もできるように なって来ている. •英語のWordNetを活用して,既存の感情辞書 DepecheMoodを拡張し,EmoWordNet(以下, EWN)を構築するといった内容. •語数は,67000語.(DepecheMoodの約1.8倍) 2
Introduction •SNSのユーザーが増えたことによって,大量の 意見・感情の含まれたテキストが使えるように なった. •感情辞書は,感情分類モデルの精度向上に寄与 している. •感情は,通常,「ポジティブ・ネガティブ・ニ ュートラル」の3つのラベルで表される. • Ekmanの感情分類(Ekman
1992)(幸福・悲しみ・ 恐怖・怒り・驚き・嫌悪感)やPlutchikのモデルに は,Ekmanの感情分類に加えて,信頼と期待が含ま れている. 3
Introduction •英語で大規模な感情辞書を作成する研究は多く あったが,既存の感情辞書のサイズは,小さい ままである. •Example: • 英語最大の感情辞書:DepecheMood • (Staiano and
Guerini 2014),約37000語 • SentiWordNet(SWN) • (Esuli and Sebastiani 2007;Baccianella et al 2010) • EWN(Fellbaum 1998)を使用して半自動的に生成された 英文の語彙レキシコンには「Positive・Negative・ Objective」の3つの感情が付与された約150000語が含ま れている. 4
Introduction •本研究は,EWNで利用可能なシソーラスを用い て,既存の感情辞書であるDepecheMoodの適 用範囲を拡大することに焦点を当てる. •DepecheMoodは,公開されている最大の感情 辞書の1つであり,その用語はEWNと整合してい る. •従って,DepecheMoodを拡張する. 5
Approach •DepecheMoodは,それぞれのエントリに8つの 感情ラベル(afraid・amused・angry・ annoyed・don’t care・happy・inspired ・sad)のスコア,POSタグと共に37771の見出 しから構成されている. •DepecheMoodには,スコア表現の3つのバリエ ーションが存在する. •
今回は,正規化スコアを用いたバリエーションを選 択. 6
7
Dataset & Coverage •SemEval 2007 task on Affective text(Strapparava and
Mihalcea, 2007) •データセットは,「anger,disgust,fear, joy,sadness,surprise」の6つの感情が 付与された1000の新しい見出しで構成されてい る. •(Staiano and Guerini,2014)の感情マッ ピングを考慮. • Fear → Afraid,Anger → Angry,Joy → Happy, Sadness → Sad,Surprise → Inspired. 8
Dataset & Coverage •カバレッジを計算するために,Python NLTKパッケ ージで入手可能なWordNet lemmatizerを使ってニ ュースheadlinesの見出し語化を行った. •名詞,動詞,形容詞,副詞とは異なるPOSタグを含む すべての単語を除外した.
•EmoWordNetは68.6%のカバレッジを達成し, DepecheMoodは67.1%のカバレッジを達成した. •カバレッジの増加が予想されたが,データセットのサ イズが比較的小さいため,増加は約1.5%に過ぎなか った。 9
Regression and Classification Results •DepecheMoodを評価するために提示されたアプロー チと同様のアプローチに従った. •前処理として,最初にPython NLTKパッケージで利 用可能なWordNet lemmatizerを使ってheadline
の見出し語化をした. •見出し語化後にnグラム(n = 3まで)を調べることで, EmoWordNetで利用可能な複数単語の語句を取得し た. •次に,名詞,動詞,形容詞,副詞の4つのPOSタグの いずれにも属していない用語をすべて削除した. 10
Regression and Classification Results •特徴量計算では,EmoWordNetとSemEvalデー タセットで重なる5つの感情ラベルの感情スコ アの合計と平均の2つのバリエーションを検討 した. •平均のスコアを用いるほうが,両方のデータの 合計スコアを使用するよりも優れたパフォーマ
ンスを発揮することが分かった. 11
12
13
14
15
Conclusion and Future Work • EmoWordNet(大規模な感情辞書)を製作した.EmoWordNetは,約 67000のEWNの単語と58000のEWN synsetと8つの感情スコアで 構成されている. •
EmoWordNetは,EWNとDepecheMoodを使用した意味拡張アプロ ーチを適用することによって自動的に構築した. • EmoWordNetは,既存の感情辞書より優れており,より優れた語彙 カバレッジを持っている. • 将来的には,より大きなデータセットでEmoWordNetのパフォーマ ンスを評価し,認識モデルの精度を向上させたい. • EmoWordNetはhttp://oma-project.comに公開されている. 16