Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION
Yuto Kamiwaki
June 27, 2018
Research
0
100
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION
2018/06/28文献紹介の発表内容
Yuto Kamiwaki
June 27, 2018
Tweet
Share
More Decks by Yuto Kamiwaki
See All by Yuto Kamiwaki
Emo2Vec: Learning Generalized Emotion Representation by Multi-task Training
yuto_kamiwaki
0
85
Modeling Naive Psychology of Characters in Simple Commonsense Stories
yuto_kamiwaki
1
150
Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
yuto_kamiwaki
0
93
Epita at SemEval-2018 Task 1: Sentiment Analysis Using Transfer Learning Approach
yuto_kamiwaki
0
100
Tensor Fusion Network for Multimodal Sentiment Analysis
yuto_kamiwaki
0
130
Sentiment Analysis: It’s Complicated!
yuto_kamiwaki
0
54
ADAPT at IJCNLP-2017 Task 4: A Multinomial Naive Bayes Classification Approach for Customer Feedback Analysis task
yuto_kamiwaki
0
84
EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet
yuto_kamiwaki
0
68
BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs
yuto_kamiwaki
0
190
Other Decks in Research
See All in Research
Task-Oriented Word Segmentation (Presentation for Doctoral Dissertation)
tathi
3
240
2022 東工大 情報通信系 研究室紹介 (大岡山) / Research@ICT, Tokyo Tech (Ookayama Campus) 2022
icttitech
0
2.7k
AIOps研究録―SREのための システム障害の自動原因診断 / SRE NEXT 2022
yuukit
5
1.4k
スマートシティ基盤FIWAREをNode-REDで使う
kikuzo
0
310
データに基づくレヴィ流行語大賞2021
levii
0
230
Stock Prediction Using Facebook Sentiment with Python
tlyu0419
0
110
データサイエンティストと博士の専門性
mtakano
1
140
Natural language processing tells us the shape of language
eumesy
0
270
Optimal Transport for Natural Language Processing
eumesy
0
260
第10回チャンピオンズミーティング・アクエリアス杯ラウンド2集計 / Umamusume Aquarius 2022 Round2
kitachan_black
0
1.1k
2022 東工大 情報通信系 研究室紹介 (すずかけ台) / Research@ICT, Tokyo Tech (Suzukakedai Campus) 2022
icttitech
0
2.8k
要点を聞いてもらえるプレゼンを作ろう
tathi
9
3.1k
Featured
See All Featured
A Tale of Four Properties
chriscoyier
149
20k
Faster Mobile Websites
deanohume
294
28k
How GitHub Uses GitHub to Build GitHub
holman
465
280k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
3
440
Atom: Resistance is Futile
akmur
255
20k
How to Ace a Technical Interview
jacobian
265
21k
Reflections from 52 weeks, 52 projects
jeffersonlam
337
17k
Fontdeck: Realign not Redesign
paulrobertlloyd
73
4.1k
Why Our Code Smells
bkeepers
PRO
324
54k
The Power of CSS Pseudo Elements
geoffreycrofte
46
3.9k
Music & Morning Musume
bryan
35
4.1k
Automating Front-end Workflow
addyosmani
1351
200k
Transcript
ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING
DISTANT SUPERVISION 長岡技術科学大学 自然言語処理研究室 上脇優人 Genta Indra Winata, Onno Pepijn Kampman, Pascale Fung Hong Kong University of Science and Technology, Clear Water Bay, Hong Kong ICASSP 2018 6月文献紹介
Abstruct •自己導出型の書き起こしからの心理的ストレスを分類す るためのattentionメカニズムを備えたLSTMを提案. •コーパスのサイズを補完して拡張するハッシュタグの内 容に基づいて,ツイートを自動的にラベル付けすること によってdistant supervisionを適用. •biLSTMモデルは,accuracy 74.1%とF値 74.3%の
点で最高のモデルである. •distant supervisionの微調整により,accuracy 1.6%,F値 2.1%向上. 2
Introduction •心理的ストレスは,人の話し方や言葉の選択に影 響する. •言語学的研究では,言語選択にストレスと精神的 健康のレベルへの指針が含まれていることが示さ れている. •うつ病の発生を予測するためのソーシャルメディ アとTwitterからのテキストデータの可能性も実 証されている. •文章レベルのストレス検出に関する研究は,主に,
マイクロブログなどのソーシャルメディアから収 集されたテキストに焦点を当てている. 3
Introduction •本研究では,面接転写から文章レベルでの心理的ストレ スを検出するための単語埋め込み型attention based LSTMモデルを構築することを提案. •本ケースでは,著者の心の強調または非ストレス状態を 示すハッシュタグを手動で選択し,ストレス(正のラベ ル)とストレスのない(負のラベル)つぶやきをスクラ ップするのに使用. •インタビューコーパスは比較的小さく,主にアカデミア
に関連する限られた数の話題しかカバーしていないため, トレーニング中にデータを追加する必要がある. 4 この論文の主な貢献は、Twitterから収集されたラベルのないデータ が,本研究のインタビュー転記コーパスの分類パフォーマンスを向上 させることができることを示し,attention mechanismを適用すると モデルが重要な単語を効果的に選択するのに役立つ.
Models •本研究の目的は,入力として発話があれば,誰か がストレスを受けているかどうかを判断可能とす ることである. •いくつかの異なるモデルを探索した. •LSTM及びBiLSTMモデルでは,最終的にストレス 及びストレスのない用語集を形成するために訓練 可能な埋め込み層を使用した. •LSTMは,文中の単語の時間的ダイナミクスを捕 捉することが可能.
5
6
7
SVM •ベースラインとして,Radial Basis Function(RBF)カーネルを用いてSVMを構築 した. •与えられた文中の単語ごとにword2vecのワード エンベディングを抽出した. •埋め込みの次元数はkは300で,Googleニュース のデータで事前に訓練されている(約1000億語 でユニークワードは約300万語).
•SVMの場合,入力はN個の発話ベクトルからなる 入力行列として表されます. 8
9
10
11
12
Conclusion •面接記録から面接者のストレスレベルを分類する 方法を提示した. •biLSTMのモデルが最高性能であった. •ドメイン外ストレスツイートデータセットを使用 した2段階トレーニング方法は,学習のパフォー マンスを向上させる. 13
Future work •言語的および音響的特徴を用いたマルチモーダル 学習をする. •transfer learningのために文法的に正しい文 章を取得する. •今回のモデルを仮想セラピストのプラットフォー ムに組み込んで自動音声出力をさせる. •これにより、システムはユーザーのストレスを認
識し,適切なストレスマネジメントのアドバイス とエクササイズで対応する. 14