Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION

ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION

2018/06/28文献紹介の発表内容

Fb31b0b39ecedd2353fa1a6e68200449?s=128

Yuto Kamiwaki

June 27, 2018
Tweet

More Decks by Yuto Kamiwaki

Other Decks in Research

Transcript

  1. ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING

    DISTANT SUPERVISION 長岡技術科学大学 自然言語処理研究室 上脇優人 Genta Indra Winata, Onno Pepijn Kampman, Pascale Fung Hong Kong University of Science and Technology, Clear Water Bay, Hong Kong ICASSP 2018 6月文献紹介
  2. Abstruct •自己導出型の書き起こしからの心理的ストレスを分類す るためのattentionメカニズムを備えたLSTMを提案. •コーパスのサイズを補完して拡張するハッシュタグの内 容に基づいて,ツイートを自動的にラベル付けすること によってdistant supervisionを適用. •biLSTMモデルは,accuracy 74.1%とF値 74.3%の

    点で最高のモデルである. •distant supervisionの微調整により,accuracy 1.6%,F値 2.1%向上. 2
  3. Introduction •心理的ストレスは,人の話し方や言葉の選択に影 響する. •言語学的研究では,言語選択にストレスと精神的 健康のレベルへの指針が含まれていることが示さ れている. •うつ病の発生を予測するためのソーシャルメディ アとTwitterからのテキストデータの可能性も実 証されている. •文章レベルのストレス検出に関する研究は,主に,

    マイクロブログなどのソーシャルメディアから収 集されたテキストに焦点を当てている. 3
  4. Introduction •本研究では,面接転写から文章レベルでの心理的ストレ スを検出するための単語埋め込み型attention based LSTMモデルを構築することを提案. •本ケースでは,著者の心の強調または非ストレス状態を 示すハッシュタグを手動で選択し,ストレス(正のラベ ル)とストレスのない(負のラベル)つぶやきをスクラ ップするのに使用. •インタビューコーパスは比較的小さく,主にアカデミア

    に関連する限られた数の話題しかカバーしていないため, トレーニング中にデータを追加する必要がある. 4 この論文の主な貢献は、Twitterから収集されたラベルのないデータ が,本研究のインタビュー転記コーパスの分類パフォーマンスを向上 させることができることを示し,attention mechanismを適用すると モデルが重要な単語を効果的に選択するのに役立つ.
  5. Models •本研究の目的は,入力として発話があれば,誰か がストレスを受けているかどうかを判断可能とす ることである. •いくつかの異なるモデルを探索した. •LSTM及びBiLSTMモデルでは,最終的にストレス 及びストレスのない用語集を形成するために訓練 可能な埋め込み層を使用した. •LSTMは,文中の単語の時間的ダイナミクスを捕 捉することが可能.

    5
  6. 6

  7. 7

  8. SVM •ベースラインとして,Radial Basis Function(RBF)カーネルを用いてSVMを構築 した. •与えられた文中の単語ごとにword2vecのワード エンベディングを抽出した. •埋め込みの次元数はkは300で,Googleニュース のデータで事前に訓練されている(約1000億語 でユニークワードは約300万語).

    •SVMの場合,入力はN個の発話ベクトルからなる 入力行列として表されます. 8
  9. 9

  10. 10

  11. 11

  12. 12

  13. Conclusion •面接記録から面接者のストレスレベルを分類する 方法を提示した. •biLSTMのモデルが最高性能であった. •ドメイン外ストレスツイートデータセットを使用 した2段階トレーニング方法は,学習のパフォー マンスを向上させる. 13

  14. Future work •言語的および音響的特徴を用いたマルチモーダル 学習をする. •transfer learningのために文法的に正しい文 章を取得する. •今回のモデルを仮想セラピストのプラットフォー ムに組み込んで自動音声出力をさせる. •これにより、システムはユーザーのストレスを認

    識し,適切なストレスマネジメントのアドバイス とエクササイズで対応する. 14