Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介 7月27日

gumigumi7
July 27, 2017
110

文献紹介 7月27日

gumigumi7

July 27, 2017
Tweet

Transcript

  1. 文献 ▪ 論文 ▪ Blevins, Terra and Kwiatkowski, Robert and

    MacBeth, Jamie and McKeown, Kathleen and Patton, Desmond and Rambow, Owen ▪ Automatically Processing Tweets from Gang-Involved Youth: Towards Detecting Loss and Aggression ▪ Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers. ▪ pp.2196-2206 ▪ キーワード ▪ 対話分析,Twitter 2
  2. 導入 ▪ アメリカでは銃によって死ぬ場合が多い ▪ 2-3時間毎に誰かが打たれている計算になるほど 銃器犯罪が多い ▪ シカゴ警察はソーシャルメディアのギャング間のやりとりが、 暴力行為を悪化させていると主張 ▪

    Web上が新たな ”ストリート” と化している (Moule et al., 2013;Patton et al., 2013; Pyrooz et al., 2015) ▪ 組織化されたギャングはWebを介して他人にちょっかいを出す 傾向が見られる. (Moule et al., 2013) 4
  3. 理論 ▪ ギャングのツイートには崩れた表現やスラングなどが多い ▪ “smoke” は “殺す” という意味も持つ ▪ 以下のアプローチ

    ▪ POSタグと談話の意味が付与されたコーパス構築 ▪ ギャングのツイートを解析するためのPOSタガー ▪ 辞書を利用してツイートの感情を分類 6
  4. 理論 ▪ コーパスの構築 ▪ Gakirah Barnesのツイートを分析 ▪ 13歳でギャング, 17歳で死亡 ▪

    友人が殺され,復讐を誓い9人を殺害 ▪ 2011年12月から2014年4月までに27000のツイートが投稿 ▪ 彼女の最後の718件のツイートと1月中の102件のツイートが分析対象 ▪ ツイートを感情ごとに分類 (暴力, 攻撃,トラウマ) ▪ ツイートに対してPOSタグを付与 ▪ 各アノテーターが同じ品詞を付与したものは全体の0.8 ▪ 副詞, 形容詞, 名詞 どれで使われても解釈できる単語のため 7
  5. 理論 ▪ ツイートの分類 ▪ ツイートの感情を素性として加える ▪ Dictionary of Affect in

    Language ▪ 8000語を3次元にマップ ▪ 快さ, 語の強さ, 単語の視覚化のしやすさ ▪ ギャングが使う絵文字 ▪ ツイートのトークンの約12.6%が絵文字 ▪ 感情を示していると思われる 9
  6. 実験 ▪ SVMを用いてツイートの分類 ▪ TCF – 3クラスに分ける (Aggression, Loss, Other)

    ▪ Aggression or Other のモデルと Loss or Otherのモデルを使う ▪ BCS – Aggression or Loss でモデルを作成 ▪ CC – Aggression, Loss or Otherを分類してBCS 10