文献紹介: Controlling Politeness in Neural Machine Translation via Side Constraints

文献紹介: Controlling Politeness in Neural Machine Translation via Side Constraints

2017/07/18の文献紹介で発表

F637b583c221c132af26c91cb3dba0ca?s=128

Yumeto Inaoka

July 18, 2017
Tweet

Transcript

  1. Controlling Politeness in Neural Machine Translation via Side Constraints Rico

    Sennrich, Barry Haddow, Alexandra Birch Proceedings of NAACL-HLT 2016, pages 35–40 1 文献紹介(2017/07/18) 自然言語処理研究室 稲岡 夢人
  2. 概要 • 敬語のない元言語の翻訳で出力の敬語制御 • 敬語の制御にSide Constraintsを使用 • 英語→ドイツ語において性能が向上 2

  3. NMT with Side Constraints • ニューラルネットに丁寧さを示す追加の 入力機能を与える • テスト時はユーザが丁寧さを入力 •

    入力文の最後にトークンとして Side Constraintsを追加 → Attention-based encoder-decoder   モデルであればSide Constraintsに   注意を払うことを学習できる 3
  4. 訓練セットへの自動注釈 • 事前に訓練セットに注釈をつける • 注釈は文レベルで付ける → ソースとターゲットで単語レベルの   対応を持たないため 4

  5. 訓練セットへの自動注釈 • ParZu(Sennrich et al., 2013)を用いて ルールに基づいて形態論的な注釈をつける • 命令形の動詞を含む文はinformalに分類 5

  6. 実験 • 訓練コーパス:OpenSubtitles (映画字幕丁 寧な文の対が48万 丁寧でない文の対が109万 • Groundhogを使用してAttention-based encoder-decoder NMTシステムを訓練

    • Side Constraintsに過度な依存をしない ように半分の確率でラベル付けした 6
  7. 結果 • informalに限定した翻訳の98%はinformal または中立 • 丁寧な文に限定した翻訳の96%は 丁寧または中立 7

  8. 結果 • 参照文をもとにSide Constraintsを与えるオ ラクル実験ではBLEUが3.2改善 8

  9. 結果 • Side ConstraintsはNMTにオーバライド されることがある → 弱い制約なため 9

  10. 結果 • ランダムサンプルにおいても同様に Side Constraintsが有効である 10

  11. 結論 • 丁寧さの注釈を訓練の追加入力として統合し てNMTの敬語生成を制御できる • 丁寧さがユーザに指定される前提であるが 将来はソーステキストから自動的に予測する ことを目指す • 本稿では丁寧さの制御に焦点を当てている

    が、幅広い現象にSide Constraintsを適用 できる可能性がある 11