Sentiment Analysis: It’s Complicated!

Sentiment Analysis: It’s Complicated! 長岡技術科学大学自然言語処理研究室上脇優人 Kian Kenyon-Dean,Eisha Ahmed,Scott
Fujimoto, Jeremy Georges-Filteau,Christopher Glasz, Barleen Kaur,Auguste Lalande,Shruti Bhanderi, Robert Belfer,Nirmal Kanagasabai,Roman Sarrazingendron,Rohit Verma,2Derek Ruths McGill University, Department of Computer Science Proceedings of NAACL-HLT 2018, pages 1886–1895 9月文献紹介

Abstract • 感情分析のデータセットでは，適切なラベルに大きな不一致がある場合，「ノイズの多い」または「複雑な」データを破棄することが一般的です． • Twitter Sentiment Analysis(TSA)の目的で構築されたデータセットでは，上記の様なデータが，最初にアノテーションしたデータの
30％以上を構成している． • 上記の様なデータの削除は，短文のReal-time sentiment Classificationを実行するとき，自動化されたシステムがどのようなサンプルが上記の様なカテゴリに入るかを事前に知ることができないため，問題がある． • したがって，このようなテキストを分類するための「複雑な」クラスの感情の概念を提案し，短文のSentiment analysisフレームワークに含めることで，現実の設定で実装されるAutomatic sentiment analysis systemの品質が向上すると考えた． 2

Introduction • ツイートの感情を自動的に判断できるTSAモデルを構築することは，ここ数年で大きな注目を集めている． • しかし，最新のTSAモデルでは機械学習を使用してパラメータを調整しているため，実際の実装環境との関連性やパフォーマンスは，訓練されたデータセットに大きく依存する． •
残念ながら，TSAデータセットの構築には，TSAモデルの設計よりも注意が払われていない． 3

Current Problems in TSA • TSAデータセットを構築するときに，多くのデータをフィルタリングしてしまっている． • 研究者は，もっと実世界の環境で使用することを想定してデータセットを構築しないといけない．
• 例えば，ツイートがSTRONGLY NEGATIVEを2つ， STRONGGLY POSITIVEを2つ，NEUTRALのラベルを1つ受け取った場合，結果のラベルはNEUTRALになります。 • しかし，ツイートは確かに「ニュートラル」ではないだろうが，ニュートラルのラベリングに関する全会一致でツイートと質的に異なる． 5

Data Collection 6

Data Annotation • データのアノテーションには，CrowdFlowerプラットフォームを使用した． • 指示書では，ツイートに表現された感情があいまいであるか，混在しているか，または肯定的/否定的なものとして解釈される可能性がある場合に，COMPLICATEDが好ましい選択肢として提示された。
• 181人の信頼できる投稿者によって合計35,926件のタスクが完了し，7,026個の注釈付きツイートを作成． 7

Dataset Analysis • 注釈付きのツイートは，満場一致（5つのうち5つがラベルで合意），コンセンサス（5つのうち4つが合意），多数（5つのうち3つが合意），またはそれ以外． 8

Dataset Analysis 9

Experiment • 目的は，最適精度で最先端の分類器を構築することではなく，アノテータの不一致に基づいてツイートサブセットを含むか除外するかが分類精度にどのように影響するかを理解． • 実験1 • 従来通り，アノテータの不一致ツイートを削除（3クラス分類
問題） • 実験2 • アノテータの不一致ツイートを含める（4クラス分類問題） 10

Results 11

Results 12

Discussion • 我々の結果は、注釈の不一致は単に人間の誤りに起因するものではないことを示している。 • 短いテキストの感情分析の分野を進めるためには、データセットの設計と開発における共通のプラクティスを変更する必要があります。 • 将来のデータセットは，アノテートされたデータを破棄す
ることなく，生の注釈ラベルの割り当てと共に公開されるべきである． 13

Conclusions • McGill Twitter Sentiment Analysis（MTSA）データセットを作成することによって，人間が実際に短文の Sentiment analysisデータセット構築において，データに注釈を付ける方法をよりよく理解する必要性を強調し
た． 14

Future work • 生の人間の注釈を利用してSentiment analysis分類子を改善し，注釈の不一致を引き起こすこれらのサンプルの「複雑な」特性をよりよく検出し理解する方法を見つけることが必要． • さらに，研究者は，教師なし，レキシコンベース，および
ルールベースの方法を含む短文Sentiment analysisのための他の方法の開発にMTSAを使用することを推奨する． 15

Sentiment Analysis: It’s Complicated!

Sentiment Analysis: It’s Complicated!

Yuto Kamiwaki

More Decks by Yuto Kamiwaki

Other Decks in Research

Featured

Transcript