Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EmoWordNet: Automatic Expansion of Emotion Lexi...
Search
Yuto Kamiwaki
July 25, 2018
Research
120
0
Share
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet
2018/07/26文献紹介の発表内容
Yuto Kamiwaki
July 25, 2018
More Decks by Yuto Kamiwaki
See All by Yuto Kamiwaki
Emo2Vec: Learning Generalized Emotion Representation by Multi-task Training
yuto_kamiwaki
0
120
Modeling Naive Psychology of Characters in Simple Commonsense Stories
yuto_kamiwaki
1
220
Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
yuto_kamiwaki
0
120
Epita at SemEval-2018 Task 1: Sentiment Analysis Using Transfer Learning Approach
yuto_kamiwaki
0
140
Tensor Fusion Network for Multimodal Sentiment Analysis
yuto_kamiwaki
0
280
Sentiment Analysis: It’s Complicated!
yuto_kamiwaki
0
92
ADAPT at IJCNLP-2017 Task 4: A Multinomial Naive Bayes Classification Approach for Customer Feedback Analysis task
yuto_kamiwaki
0
180
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION
yuto_kamiwaki
0
160
BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs
yuto_kamiwaki
0
260
Other Decks in Research
See All in Research
Collective Predictive Coding and World Models in LLMs: A System 0/1/2/3 Perspective on Hierarchical Physical AI (IEEE SII 2026 Plenary Talk)
tanichu
1
400
姫路市 -都市OSの「再実装」-
hopin
0
1.7k
進学校の生徒にはア行の苗字が多いのか
ozekinote
0
410
「なんとなく」の顧客理解から脱却する ──顧客の解像度を武器にするインサイトマネジメント
tajima_kaho
10
7.6k
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
380
さくらインターネット研究所テックトーク2026春、研究開発Gr.25年度成果26年度方針
kikuzo
0
140
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
1.1k
Ghost in the 7‑Zip: The Shadow of Residential Proxies Creeping into Your Life
nttcom
0
180
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
170
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
1.2k
Apache Gravitinoで実現する Icebergカタログ統合とアクセスの一元化
matsumooon
0
220
Φ-Sat-2のAutoEncoderによる情報圧縮系論文
satai
4
710
Featured
See All Featured
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
420
Are puppies a ranking factor?
jonoalderson
1
3.4k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
180
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
310
Typedesign – Prime Four
hannesfritz
42
3k
Six Lessons from altMBA
skipperchong
29
4.2k
Believing is Seeing
oripsolob
1
130
How to build a perfect <img>
jonoalderson
1
5.5k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
Practical Orchestrator
shlominoach
191
11k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
Speed Design
sergeychernyshev
33
1.7k
Transcript
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet 長岡技術科学大学
自然言語処理研究室 上脇優人 Gilbert Badaro,Hussein Jundi,Harzem Hajj, Wassim El-Hajj Lexical and Computational Semantics(*SEM), 2018,pp86-93 7月文献紹介
Abstract •過去10年間,テキストから感情極性を抽出する ために多くの研究がされている. •最近は,テキストから感情認識もできるように なって来ている. •英語のWordNetを活用して,既存の感情辞書 DepecheMoodを拡張し,EmoWordNet(以下, EWN)を構築するといった内容. •語数は,67000語.(DepecheMoodの約1.8倍) 2
Introduction •SNSのユーザーが増えたことによって,大量の 意見・感情の含まれたテキストが使えるように なった. •感情辞書は,感情分類モデルの精度向上に寄与 している. •感情は,通常,「ポジティブ・ネガティブ・ニ ュートラル」の3つのラベルで表される. • Ekmanの感情分類(Ekman
1992)(幸福・悲しみ・ 恐怖・怒り・驚き・嫌悪感)やPlutchikのモデルに は,Ekmanの感情分類に加えて,信頼と期待が含ま れている. 3
Introduction •英語で大規模な感情辞書を作成する研究は多く あったが,既存の感情辞書のサイズは,小さい ままである. •Example: • 英語最大の感情辞書:DepecheMood • (Staiano and
Guerini 2014),約37000語 • SentiWordNet(SWN) • (Esuli and Sebastiani 2007;Baccianella et al 2010) • EWN(Fellbaum 1998)を使用して半自動的に生成された 英文の語彙レキシコンには「Positive・Negative・ Objective」の3つの感情が付与された約150000語が含ま れている. 4
Introduction •本研究は,EWNで利用可能なシソーラスを用い て,既存の感情辞書であるDepecheMoodの適 用範囲を拡大することに焦点を当てる. •DepecheMoodは,公開されている最大の感情 辞書の1つであり,その用語はEWNと整合してい る. •従って,DepecheMoodを拡張する. 5
Approach •DepecheMoodは,それぞれのエントリに8つの 感情ラベル(afraid・amused・angry・ annoyed・don’t care・happy・inspired ・sad)のスコア,POSタグと共に37771の見出 しから構成されている. •DepecheMoodには,スコア表現の3つのバリエ ーションが存在する. •
今回は,正規化スコアを用いたバリエーションを選 択. 6
7
Dataset & Coverage •SemEval 2007 task on Affective text(Strapparava and
Mihalcea, 2007) •データセットは,「anger,disgust,fear, joy,sadness,surprise」の6つの感情が 付与された1000の新しい見出しで構成されてい る. •(Staiano and Guerini,2014)の感情マッ ピングを考慮. • Fear → Afraid,Anger → Angry,Joy → Happy, Sadness → Sad,Surprise → Inspired. 8
Dataset & Coverage •カバレッジを計算するために,Python NLTKパッケ ージで入手可能なWordNet lemmatizerを使ってニ ュースheadlinesの見出し語化を行った. •名詞,動詞,形容詞,副詞とは異なるPOSタグを含む すべての単語を除外した.
•EmoWordNetは68.6%のカバレッジを達成し, DepecheMoodは67.1%のカバレッジを達成した. •カバレッジの増加が予想されたが,データセットのサ イズが比較的小さいため,増加は約1.5%に過ぎなか った。 9
Regression and Classification Results •DepecheMoodを評価するために提示されたアプロー チと同様のアプローチに従った. •前処理として,最初にPython NLTKパッケージで利 用可能なWordNet lemmatizerを使ってheadline
の見出し語化をした. •見出し語化後にnグラム(n = 3まで)を調べることで, EmoWordNetで利用可能な複数単語の語句を取得し た. •次に,名詞,動詞,形容詞,副詞の4つのPOSタグの いずれにも属していない用語をすべて削除した. 10
Regression and Classification Results •特徴量計算では,EmoWordNetとSemEvalデー タセットで重なる5つの感情ラベルの感情スコ アの合計と平均の2つのバリエーションを検討 した. •平均のスコアを用いるほうが,両方のデータの 合計スコアを使用するよりも優れたパフォーマ
ンスを発揮することが分かった. 11
12
13
14
15
Conclusion and Future Work • EmoWordNet(大規模な感情辞書)を製作した.EmoWordNetは,約 67000のEWNの単語と58000のEWN synsetと8つの感情スコアで 構成されている. •
EmoWordNetは,EWNとDepecheMoodを使用した意味拡張アプロ ーチを適用することによって自動的に構築した. • EmoWordNetは,既存の感情辞書より優れており,より優れた語彙 カバレッジを持っている. • 将来的には,より大きなデータセットでEmoWordNetのパフォーマ ンスを評価し,認識モデルの精度を向上させたい. • EmoWordNetはhttp://oma-project.comに公開されている. 16