Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介(対話行為に固有の特徴を考慮した自由対話システムにおける対話行為推定)

shu_suzuki
January 30, 2019

 文献紹介(対話行為に固有の特徴を考慮した自由対話システムにおける対話行為推定)

長岡技術科学
自然言語処理研究室
鈴木脩右

文献情報
対話行為に固有の特徴を考慮した自由対話システムにおける対話行為推定
福岡 知隆 , 白井 清昭
自然言語処理 ,Vol.24,No.4,p.523-547,2017

※本スライドの図表は論文より引用しています

shu_suzuki

January 30, 2019
Tweet

More Decks by shu_suzuki

Other Decks in Technology

Transcript

  1. 提案手法 • あらかじめ定義された対話行為の分 類クラスから最適なクラスを選択 • 対話行為に該当するか判定する二値 分類器を L2 正則化ロジスティック回 帰により学習

    • 学習ツールは LIBLINEAR(Fan, Chang, Hsieh, Wang, and Lin 2008) • 対話行為毎に最適な特徴を実験的に決 め, 分類と同時に判定の信頼度も算出 • 対話行為の選択アルゴリズムには 4 つの手法を提案 (後述) Figure 1: 提案手法の流れ 3
  2. 機械学習に用いる特徴 4 グループに分類 • グループ 1 f1〜 f10 発話の内容, 全ての対話行為の分類に有効な特徴

    • グループ 2 f11〜 f17 発話の内容, 特定の対話行為の推定に有効な特徴 • グループ 3 f18〜 f21 発話の内容以外の情報, 全ての対話行為の分類に有効な特徴 • グループ 4 f22〜 f28 発話の内容以外の情報, 特定の対話行為の推定に有効な特徴 Table 2: 対話行為推定のための特徴 5
  3. 特徴セットの最適化 • 個々の対話行為に対し,分類に有効でない特徴を削除する • 対話行為毎に, 開発データでの F 値が最大となる対話行為列 Nh(= 1,

    2, 3, 4, 5) を 選択する • Nh の値が大きいときには特徴量の数が増えるため, 特徴量を選択 • 最も有効な特徴の特徴量とそれ以外の特徴量の組のみを組み合わせ特徴量とし, 導入 6
  4. 対話行為の選択 • 判定の信頼度による選択 (Prop ) -二値分類器が出力する信頼度が最も高い対話行為を選択 • 信頼度を特徴量とする機械学習による手法 (Prom )

    -二値分類器の出力結果を特徴量とし, 対話行為を選択するモデルを機械学習する • 信頼度に対する重み付けに基づく手法 (Prow ) -信頼度の不均衡を是正するため重み付けを行う • 特定の対話行為の組に対して機械学習で識別する手法 (Prob ) -識別が難しい対話行為の組に対する分類器を機械学習する 7
  5. 実験データ • 対話コーパスとして, 名大会話コーパス ( 国立国語研究所 2001) を使用 • コーパスの中から参加者が二名の対話のみを選択し,

    各発話に対し対話行為タグ を人手で付与した • 97 対話 (91,906 発話) を 77 対話 (74,228 発話) を訓練データ, 10 対話 (8,984 発話) を開発データ, 10 対話 ( 8,694 発話) をテストデータに分割 Table 3: 実験データにおける対話行為の出現頻度の分布 8
  6. 対話行為推定の評価 各対話行為の推定の精度, 再現率, F 値, ならびにこれら 3 つの全対話行為についての マクロ平均とマイクロ平均で評価 特定の対話行為の組に対して機械学習で識別する手法

    (Prob ) が最も結果が良かった BLs と (Prob ) をマクネマー検定で検定したところ, 5% の有意水準で有意差があった Table 5: 対話行為推定タスクの結果 10