Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介:Towards an Automatic Turing Test: Learning...

文献紹介:Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses

長岡技術科学大学
自然言語処理研究室
文献紹介
鈴木脩右

Avatar for shu_suzuki

shu_suzuki

April 01, 2019
Tweet

More Decks by shu_suzuki

Other Decks in Technology

Transcript

  1. 文献紹介 Towards an Automatic Turing Test: Learning to Evaluate Dialogue

    Responses 鈴木脩右 2019/4/1 長岡技術科学大学 自然言語処理研究室 1
  2. 文献情報 [1] Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas

    Angelard-Gontier, Yoshua Bengio, and Joelle Pineau. Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 1116–1126, Vancouver, Canada, July 2017. Association for Computational Linguistics. 2
  3. 背景 • 非タスク指向対話システムの評価指標には BLEU が使わるこ とが多い • BLEU では意味的類似性や文脈依存性を測れない •

    応答生成は多様性があるため,BLEU は不向き • 人手評価との相関がないことも指定されている [Liu et al. 2016] 4
  4. 評価対象 • Twitter コーパスを対象に応答を生成 • 評価対象は 4 つ • TF-IDF

    ベース • Dual Encoder ベース • HRED • 人間が作った応答文 8