Slide 1

Slide 1 text

Controlling Politeness in Neural Machine Translation via Side Constraints Rico Sennrich, Barry Haddow, Alexandra Birch Proceedings of NAACL-HLT 2016, pages 35–40 1 文献紹介(2017/07/18) 自然言語処理研究室 稲岡 夢人

Slide 2

Slide 2 text

概要 ● 敬語のない元言語の翻訳で出力の敬語制御 ● 敬語の制御にSide Constraintsを使用 ● 英語→ドイツ語において性能が向上 2

Slide 3

Slide 3 text

NMT with Side Constraints ● ニューラルネットに丁寧さを示す追加の 入力機能を与える ● テスト時はユーザが丁寧さを入力 ● 入力文の最後にトークンとして Side Constraintsを追加 → Attention-based encoder-decoder   モデルであればSide Constraintsに   注意を払うことを学習できる 3

Slide 4

Slide 4 text

訓練セットへの自動注釈 ● 事前に訓練セットに注釈をつける ● 注釈は文レベルで付ける → ソースとターゲットで単語レベルの   対応を持たないため 4

Slide 5

Slide 5 text

訓練セットへの自動注釈 ● ParZu(Sennrich et al., 2013)を用いて ルールに基づいて形態論的な注釈をつける ● 命令形の動詞を含む文はinformalに分類 5

Slide 6

Slide 6 text

実験 ● 訓練コーパス:OpenSubtitles (映画字幕丁 寧な文の対が48万 丁寧でない文の対が109万 ● Groundhogを使用してAttention-based encoder-decoder NMTシステムを訓練 ● Side Constraintsに過度な依存をしない ように半分の確率でラベル付けした 6

Slide 7

Slide 7 text

結果 ● informalに限定した翻訳の98%はinformal または中立 ● 丁寧な文に限定した翻訳の96%は 丁寧または中立 7

Slide 8

Slide 8 text

結果 ● 参照文をもとにSide Constraintsを与えるオ ラクル実験ではBLEUが3.2改善 8

Slide 9

Slide 9 text

結果 ● Side ConstraintsはNMTにオーバライド されることがある → 弱い制約なため 9

Slide 10

Slide 10 text

結果 ● ランダムサンプルにおいても同様に Side Constraintsが有効である 10

Slide 11

Slide 11 text

結論 ● 丁寧さの注釈を訓練の追加入力として統合し てNMTの敬語生成を制御できる ● 丁寧さがユーザに指定される前提であるが 将来はソーステキストから自動的に予測する ことを目指す ● 本稿では丁寧さの制御に焦点を当てている が、幅広い現象にSide Constraintsを適用 できる可能性がある 11