Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文字対話における対話関係成立の可否判別

 文字対話における対話関係成立の可否判別

三ノ宮和俊, 山本和英. 文字対話における対話関係成立の可否判別. 言語処理学会第18回年次大会, pp.831-834 (2012.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 対数尤度比の算出方法 各変数の説明 a: 語Aがツイート文、語Bが返信文に存在する場合の発話対の数 b: 語Aがツイート文に存在し、語Bが返信文に存在しない場合の 発話対の数 c: 語Bが返信文に存在し、語Aがツイート文に存在しない場合の 発話対の数

    d: 語Aも語Bも存在しない場合の発話対の数 N: 対数尤度比算出の際に使用した全発話対の数 5             d c d b dN d d c c a cN c d b b a bN b c a b a aN a LLR             log log log log    
  2. 語Aと語Bについての対数尤度比 語A 語B a b c d N LLR 例1

    旅行 ハワイ 1 190 16 181924 182131 3.076 例2 大学 研究 2 324 100 181705 182131 2.991 例3 腹痛 良い 1 67 29232 179141 182131 0.004 6
  3. (B) 対象発話対の疑問判定 7 疑問や質問に対する応答によって対話関係の 可否判別を行う素性 • 文字対話における疑問判定の素性は以下の ように仮定 • 疑問であるか否かの判定は文内の疑問符の

    有無で行った ツイートが疑問ではない場合 ツイートが疑問ある場合 返信が疑問でない場合 素性として1を付与 素性として1を付与 返信が疑問である場合 素性として1を付与 素性として0を付与
  4. 可否判別実験の結果 使用した 素性情報 正例データに 関する適合率 負例データに 関する適合率 全体の適合率 ベースライン 0.395

    0.885 0.640 (A) 0.441 0.711 0.576 (B) 0.982 0.021 0.502 (C) 0.097 0.935 0.516 (A)(B) 0.441 0.711 0.576 (A)(C) 0.441 0.711 0.576 (B)(C) 0.113 0.915 0.514 (A)(B)(C) 0.441 0.711 0.576 11
  5. 語の共起情報でのみ 対話関係を正確に判別できた例 12 例1 ツイート:面接終わった 返信: お疲れおかえり! 例2 ツイート:うっし寝るかー。 おやすみなさーい!

    返信: おやすみなさいませ 良き夢を 「終わる⇔つかれる」の 共起情報により正例と判別 「寝る⇔夢」の 共起情報により 正例と判別
  6. 補足資料: データクラスタリングツール「bayon」 • クラスタリング手法としてRepeated Bisection法を採用 • Repeated Bisectionでは以下の1-4の処理を繰り返し実行することでクラスタリ ングを行う 1.

    分割するクラスタを選択(一番クラスタ内のまとまりが悪いものを選択) 2. クラスタ中からランダムに2つ要素を選択し、それぞれを格納したクラスタを 作成 3. 元のクラスタ中の全ての要素に対し、2で選んだ要素との類似度を求め、類 似度が高い方のクラスタに要素を追加する 4. 2クラスタ間で要素の移動を行い、分割結果の洗練を行う(移動できる要素が なくなるまで続ける) 引用ページ:「mixi Engineers' Blog » 軽量データクラスタリングツールbayon」 http://alpha.mixi.co.jp/blog/?p=1049
  7. 補足資料:LIBSVM • 台湾国立大学のLinらによって作成されたSVMのラ イブラリ • 設定はデフォルトのままで使用 SVMのタイプ:C-SVC カーネル関数のタイプ:RBF(radial basis function)

    exp(-gamma*|u-v|^2) • 他のSVMタイプとしてnu-SVC、one-class SVM、 epsilon-SVR、nu-SVRが選択可能 • 他のカーネル関数として線形、多項式、シグモイドが 選択可能