長岡技術科学大学 B4 三上侑城文献紹介 2015年8月20日マイクロブログにおける感情・コミュニケーション・動作タイプの推定に基づく顔文字の推薦自然言語処理研究室1
View Slide
出典マイクロブログにおける感情・コミュニケーション・動作タイプの推定に基づく顔文字の推薦江村 優花 , 関 洋平自然言語処理 Vol. 19(2012) No. 52
概要顔文字は便利であるが、反面、その種類は膨大で適切なものを選ぶのが難しい。本研究では、入力したテキストから推定し、適切な顔文字を推薦する。結果、91件のつぶやきに対して、66.6%の顔文字が適切に推定された。3
カテゴリの定義顔文字推薦システムには、大きく分けて・カテゴリ推定・顔文字推薦の2種類の処理から構成される。4
カテゴリの調査方法カテゴリ推定を行うにあたって、必要な各カテゴリを明らかにするために、調査した。顔文字92個を含むつぶやきデータに、・感情:喜,怒,哀,恥,怖,好,厭,昂,安,驚・極性:ポジティブ,ネガティブ,なしの情報を付与した。5
カテゴリの調査方法しかし、この感情カテゴリに分類することが、できなかったものは、新しく定義した。感情の種類不快,不安,期待,疲れ を追加感情以外(コミュニケーション・動作タイプ)謝罪,睡眠 を追加6
定義したカテゴリ体型7
定義したカテゴリ体型8
システムの実現システム全体の流れとして1.ユーザが文章を入力2.入力文章からカテゴリ推定3.その結果より顔文字を取り出す4.5件の顔文字候補を表示9
必要なデータの作成顔文字は初期では92個にしていたが、十分な数でなかったため、163個にした。カテゴリ体型を用いて、タグ付きコーパスを作成した。コーパスの文章は実際のツイートから顔文字が入っているものを選んだ。→最終的に3975件を作成10
必要なデータの作成カテゴリ体型を用いて、手がかり語辞書を作成した。1440語の項目を設定し、それぞれに極性、カテゴリ・タイプを付与した。オンライン上の表現も含むおはよう:(おはよ,おはよー,おはよ~)11
カテゴリ推定処理カテゴリ推定を行うために、分類器を構築した。文章を入力すると、格学習データ(タグ付きコーパス)との類似度を計算し、上位にあるものの中で最も多い感情を結果として返す。12
カテゴリ推定処理入力文に複数の手がかり語が含まれる場合は、推測を誤る可能性がある。(例)「おかえり~今日はありがとね」※あいさつの顔文字が選ばれてしまう。そのため、以下のように重み付けをした。N:手がかり語総数 n:n番目に現れる手がかり語13
実験テスト用のつぶやきデータを用意し、そのデータと、被験者が自由に入力したものに対して適切に推薦されたか判断した。2つの推薦結果に対して実験し、・提案手法 :本手法・ベースライン:学習データを感情カテゴリに限定した時14
実験結果テスト用のつぶやきデータ15
実験結果被験者が自由に入力したデータ16
まとめユーザの入力文から感情及び、コミュニケーション・動作を反映させたカテゴリを推定し、顔文字を推薦する手法を提案した。被験者実験をおこなったところ、結果平均66.6%の精度で顔文字が文章に対して適切に推薦された。17
ご視聴ありがとうございました18