Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION

ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION

2018/06/28文献紹介の発表内容

Yuto Kamiwaki

June 27, 2018
Tweet

More Decks by Yuto Kamiwaki

Other Decks in Research

Transcript

  1. ATTENTION-BASED LSTM FOR
    PSYCHOLOGICAL STRESS DETECTION
    FROM SPOKEN LANGUAGE
    USING DISTANT SUPERVISION
    長岡技術科学大学
    自然言語処理研究室
    上脇優人
    Genta Indra Winata, Onno Pepijn Kampman,
    Pascale Fung
    Hong Kong University of Science and
    Technology, Clear Water Bay, Hong Kong
    ICASSP 2018
    6月文献紹介

    View Slide

  2. Abstruct
    •自己導出型の書き起こしからの心理的ストレスを分類す
    るためのattentionメカニズムを備えたLSTMを提案.
    •コーパスのサイズを補完して拡張するハッシュタグの内
    容に基づいて,ツイートを自動的にラベル付けすること
    によってdistant supervisionを適用.
    •biLSTMモデルは,accuracy 74.1%とF値 74.3%の
    点で最高のモデルである.
    •distant supervisionの微調整により,accuracy
    1.6%,F値 2.1%向上.
    2

    View Slide

  3. Introduction
    •心理的ストレスは,人の話し方や言葉の選択に影
    響する.
    •言語学的研究では,言語選択にストレスと精神的
    健康のレベルへの指針が含まれていることが示さ
    れている.
    •うつ病の発生を予測するためのソーシャルメディ
    アとTwitterからのテキストデータの可能性も実
    証されている.
    •文章レベルのストレス検出に関する研究は,主に,
    マイクロブログなどのソーシャルメディアから収
    集されたテキストに焦点を当てている.
    3

    View Slide

  4. Introduction
    •本研究では,面接転写から文章レベルでの心理的ストレ
    スを検出するための単語埋め込み型attention based
    LSTMモデルを構築することを提案.
    •本ケースでは,著者の心の強調または非ストレス状態を
    示すハッシュタグを手動で選択し,ストレス(正のラベ
    ル)とストレスのない(負のラベル)つぶやきをスクラ
    ップするのに使用.
    •インタビューコーパスは比較的小さく,主にアカデミア
    に関連する限られた数の話題しかカバーしていないため,
    トレーニング中にデータを追加する必要がある.
    4
    この論文の主な貢献は、Twitterから収集されたラベルのないデータ
    が,本研究のインタビュー転記コーパスの分類パフォーマンスを向上
    させることができることを示し,attention mechanismを適用すると
    モデルが重要な単語を効果的に選択するのに役立つ.

    View Slide

  5. Models
    •本研究の目的は,入力として発話があれば,誰か
    がストレスを受けているかどうかを判断可能とす
    ることである.
    •いくつかの異なるモデルを探索した.
    •LSTM及びBiLSTMモデルでは,最終的にストレス
    及びストレスのない用語集を形成するために訓練
    可能な埋め込み層を使用した.
    •LSTMは,文中の単語の時間的ダイナミクスを捕
    捉することが可能.
    5

    View Slide

  6. 6

    View Slide

  7. 7

    View Slide

  8. SVM
    •ベースラインとして,Radial Basis
    Function(RBF)カーネルを用いてSVMを構築
    した.
    •与えられた文中の単語ごとにword2vecのワード
    エンベディングを抽出した.
    •埋め込みの次元数はkは300で,Googleニュース
    のデータで事前に訓練されている(約1000億語
    でユニークワードは約300万語).
    •SVMの場合,入力はN個の発話ベクトルからなる
    入力行列として表されます.
    8

    View Slide

  9. 9

    View Slide

  10. 10

    View Slide

  11. 11

    View Slide

  12. 12

    View Slide

  13. Conclusion
    •面接記録から面接者のストレスレベルを分類する
    方法を提示した.
    •biLSTMのモデルが最高性能であった.
    •ドメイン外ストレスツイートデータセットを使用
    した2段階トレーニング方法は,学習のパフォー
    マンスを向上させる.
    13

    View Slide

  14. Future work
    •言語的および音響的特徴を用いたマルチモーダル
    学習をする.
    •transfer learningのために文法的に正しい文
    章を取得する.
    •今回のモデルを仮想セラピストのプラットフォー
    ムに組み込んで自動音声出力をさせる.
    •これにより、システムはユーザーのストレスを認
    識し,適切なストレスマネジメントのアドバイス
    とエクササイズで対応する.
    14

    View Slide