Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Web上の誹謗中傷を表す文の自動検出

 Web上の誹謗中傷を表す文の自動検出

石坂 達也. Web上の誹謗中傷を表す文の自動検出. 長岡技術科学大学修士論文 (2011.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 2 発表の流れ 1. 研究の背景と目的 2. 各種定義 3. 提案手法   3.1 システム概要図

      3.2 単語悪口度の算出   3.3 基本単語の選定   3.4 誹謗中傷文の検出 4. まとめ
  2. 3 発表の流れ 1. 研究の背景と目的 2. 各種定義 3. 提案手法   3.1 システム概要図

      3.2 単語悪口度の算出   3.3 基本単語の選定   3.4 誹謗中傷文の検出 4. まとめ
  3. 7 発表の流れ 1. 研究の背景と目的 2. 各種定義 3. 提案手法   3.1 システム概要図

      3.2 単語悪口度の算出   3.3 基本単語の選定   3.4 誹謗中傷文の検出 4. まとめ
  4. 9 発表の流れ 1. 研究の背景と目的 2. 各種定義 3. 提案手法   3.1 システム概要図

      3.2 単語悪口度の算出   3.3 基本単語の選定   3.4 誹謗中傷文の検出 4. まとめ
  5. 11 単語悪口度の定義 悪口文の特徴 悪口単語を含む文が多い (例) お前は馬鹿 文や句の悪口表現を含む文 (例) サル以下の脳みそ 皮肉を表現している文

    (例) あいつは頭いいからなww 悪口度 • 悪口単語であるかどうかの可能性を示す • 悪意が強い/弱いを意味しない 悪口の対象者の情報を必要になり、問題が大きすぎる。 本研究では皮肉は対象外 悪口単語の認識は多くの悪口文検出につながる 悪口単語か否かを判別に悪口度を活用
  6. 13 発表の流れ 1. 研究の背景と目的 2. 各種定義 3. 提案手法   3.1 システム概要図

      3.2 単語悪口度の算出   3.3 基本単語の選定   3.4 誹謗中傷文の検出 4. まとめ
  7. 17 基本単語選定の結果 単語 MI合計 共起した 悪口単語数 死ね 13.61 63 消えろ

    3.492 41 蛆虫 2.430 21 カス 0.7394 43 死ねよ 0.6666 31 童貞 0.6294 50 厨 0.3285 51 池沼 0.2948 23 孤独 0.2552 27 ホモ 0.2386 33 単語 出現頻度 (× 10 ) 引換 49 買い上げ 43 絞り込み 29 降順 25 振替 23 昇順 22 引き継ぎ 20 停留所 20 負い 18 策定 17 6 悪口極性の基本単語候補 非悪口極性の基本単語候補
  8. 18 評価実験 評価用データ 異なり数2735単語 悪口単語 80語 非悪口単語 2655 語 3人の評価者が単語を悪口単語か否かを判断

    3人一致で悪口単語なら悪口単語 それ以外を非悪口単語 評価方法 順位をもとした評価 悪口度が高い上位200単語の中にいくつ悪口単語があるか 単語に悪口度を与え、適切かどうかを検証
  9. 19 評価実験結果 上位5語のみを用いて実験を行った 死ね 消えろ 蛆虫 カス 童貞 引換 42

    41 38 38 44 買い上げ 41 46 44 44 44 絞り込み 39 40 40 40 45 降順 35 40 38 38 43 振替 50 50 33 49 50 意味的な逆を考慮した時の実験結果 賞賛単語の平均認識数:20.1 人が悪口と無関係であると連想する語:30.9 平均認識数:41.0
  10. 20 発表の流れ 1. 研究の背景と目的 2. 各種定義 3. 提案手法   3.1 システム概要図

      3.2 単語悪口度の算出   3.3 基本単語の選定   3.4 誹謗中傷文の検出 4. まとめ
  11. 24 悪口度を用いた素性の足切り 学習データへの変換例(閾値=0) 入力文: お前みたいな認識の馬鹿は死ねば良い • お前 (0.28) • みたい

    (-0.02) • 認識 (-0.22) • 馬鹿 (0.18) • 死ね (0.37) • 良い (-0.34) • お前 (0.28) • 馬鹿 (0.18) • 死ね (0.37) 閾値による足切り後の素性 悪口度算出 ※括弧内の数値は悪口度。重みではない
  12. 25 評価用データ & 評価方法 評価用データ 悪口文/非悪口文 各1403文 評価方法 適合率, 再現率,

    F値による評価 5分割交差検定 適合率= 出力と正解の一致数 出力の数 再現率= 出力と正解の一致数 正解の数 F値= 2×適合率×再現率 適合率再現率
  13. 26 実験結果 F値の最大値 90.0 (閾値=-0.2) 適合率 92.5 再現率 87.0 適合率

    86.6 再現率 82.0 ベースラインF値 84.2 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 40 50 60 70 80 90 100 適合率 再現率 F 値 悪口度閾値 適合率 , 再現率 ,F 値 (全単語を素性に使用)
  14. 27 発表の流れ 1. 研究の背景と目的 2. 各種定義 3. 提案手法   3.1 システム概要図

      3.2 単語悪口度の算出   3.3 基本単語の選定   3.4 誹謗中傷文の検出 4. まとめ
  15. 32 関連研究(2/2) 単語の評価極性の判別手法 1.Turney and Littman, 2002 極性を示す代表的な語(基本単語) を用意 単語

    w が “excellent” と “poor” のどちらと共起しているか “excellent”ならば w は肯定極性, 逆なら w 否定極性 Web検索エンジンを使用して共起情報を獲得 2. Wang and Araki, 2008 Turney らの手法を日本語用に改良 “すばらしい” と “不良” ではヒット件数の差が大きい ヒット件数の差を考慮する要素を追加
  16. 36 他の分類手法の比較 規則による分類手法 1つでも悪口単語を含むなら悪口文 最大 F値 82.4(適合率 74.7, 再現率 91.8) 閾値=0.2

    悪口度の総和が閾値を超えるなら悪口文 最大 F値 75.3 (適合率 68.0, 再現率 86.2) 閾値=-0.7 悪口単語の数が非悪口単語の数を超えるなら悪口文 最大 F値 74.8 (適合率 63.7, 再現率 90.6) 閾値=-4 機械学習による分類手法 文内の全ての単語が素性 F値 84.2 (適合率 86.6, 再現率 82.0) 閾値を超える悪口度を持つ単語のみを素性 最大 F値 90.0 (適合率 92.5, 再現率 87.0) 閾値=-0.2
  17. 42 比較手法 藤村らの手法を比較手法とする [藤村ら 2005] 評価表現の極性(肯定/否定)の分類するための手法 悪口文集合と非悪口文集合のどちらに多く出現しているかを算出 悪口文/非悪口文 それぞれ1400文 を人手により収集

    F w= P P w−P N w P P wP N w −1 ≤ Fw ≤ 1  w : 対象となる単語  PP (w) : 悪口文集合内でのwの出現確率  PN (w) : 非悪口文集合内でのwの出現確率
  18. 43 評価結果 - 含有数上位下位5件 - 基本単語 (悪/非悪) 提案手法 藤村手法 ブス/机

    48 ブサイク/四角い 48 ブサイク/机 47 ブサイク/酸っぱい 46 ブサイク/赤い 46 : : 無能/イケメン 6 嫌い/可愛い 4 嫌い/素晴らしい 2 嫌い/カッコいい 0 嫌い/イケメン 0 16
  19. 44 評価結果 - 全組み合わせの含有数 - 0 20 40 60 80

    100 120 0 10 20 30 40 50 60 各種基本単語 藤村手法 各基本単語の組み合わせ 悪口単語含有数
  20. 48 学習データ & 実験方法 & 評価方法 学習データ 悪口文/非悪口文 各1403文 2ちゃんねるより収集

    実験方法 5分割交差検定 評価方法 適合率, 再現率, F値による評価 適合率= 出力と正解の一致数 出力の数 再現率= 出力と正解の一致数 正解の数 F値= 2×適合率×再現率 適合率再現率
  21. 49 SO-PMIを高くする単語とは C w=log hitw , w p ∗hit w

    n  hitw , w n ∗hit w p   SO-PMIの主要部分 = log hit w ,w p  hitw p  hit w ,w n  hitw n   相互情報量 相互情報量(MI) 赤枠MI:大 青枠MI:小 SO-PMI:大 wを悪口単語とした時、 MIが高い単語 MIが小さい単語を探す
  22. 51 悪口度算出手法  SO-PMI [Wang and Araki, 2008] を使用 Cw=log

    hitw ,w p ∗hit w n  hitw ,w n ∗hitw p   f =∗log hit w p  hit w n   SO‐ PMI w=C w f  SO-PMI (w) = 悪口度(w)
  23. 52 悪口度算出手法  SO-PMI [Wang and Araki, 2008] を使用 Cw=log

    hitw ,w p ∗hit w n  hitw ,w n ∗hitw p   f =∗log hit w p  hit w n   SO‐ PMI w=C w f  wp :悪口極性の基本単語 wn :非悪口極性の基本単語 hit 関数 :Web検索ヒット件数 f 関数:検索ヒット件数の差を考慮した重み(α=0.9)