w が “excellent” と “poor” のどちらと共起しているか “excellent”ならば w は肯定極性, 逆なら w 否定極性 Web検索エンジンを使用して共起情報を獲得 2. Wang and Araki, 2008 Turney らの手法を日本語用に改良 “すばらしい” と “不良” ではヒット件数の差が大きい ヒット件数の差を考慮する要素を追加
n hitw , w n ∗hit w p SO-PMIの主要部分 = log hit w ,w p hitw p hit w ,w n hitw n 相互情報量 相互情報量(MI) 赤枠MI:大 青枠MI:小 SO-PMI:大 wを悪口単語とした時、 MIが高い単語 MIが小さい単語を探す
hitw ,w p ∗hit w n hitw ,w n ∗hitw p f =∗log hit w p hit w n SO‐ PMI w=C w f wp :悪口極性の基本単語 wn :非悪口極性の基本単語 hit 関数 :Web検索ヒット件数 f 関数:検索ヒット件数の差を考慮した重み(α=0.9)