2017/07/18の文献紹介で発表
Controlling Politeness inNeural Machine Translationvia Side ConstraintsRico Sennrich, Barry Haddow, Alexandra BirchProceedings of NAACL-HLT 2016, pages35–401文献紹介(2017/07/18)自然言語処理研究室 稲岡 夢人
View Slide
概要● 敬語のない元言語の翻訳で出力の敬語制御● 敬語の制御にSide Constraintsを使用● 英語→ドイツ語において性能が向上2
NMT with Side Constraints● ニューラルネットに丁寧さを示す追加の入力機能を与える● テスト時はユーザが丁寧さを入力● 入力文の最後にトークンとしてSide Constraintsを追加→ Attention-based encoder-decoder モデルであればSide Constraintsに 注意を払うことを学習できる3
訓練セットへの自動注釈● 事前に訓練セットに注釈をつける● 注釈は文レベルで付ける→ ソースとターゲットで単語レベルの 対応を持たないため4
訓練セットへの自動注釈● ParZu(Sennrich et al., 2013)を用いてルールに基づいて形態論的な注釈をつける● 命令形の動詞を含む文はinformalに分類5
実験● 訓練コーパス:OpenSubtitles (映画字幕丁寧な文の対が48万丁寧でない文の対が109万● Groundhogを使用してAttention-basedencoder-decoder NMTシステムを訓練● Side Constraintsに過度な依存をしないように半分の確率でラベル付けした6
結果● informalに限定した翻訳の98%はinformalまたは中立● 丁寧な文に限定した翻訳の96%は丁寧または中立7
結果● 参照文をもとにSide Constraintsを与えるオラクル実験ではBLEUが3.2改善8
結果● Side ConstraintsはNMTにオーバライドされることがある→ 弱い制約なため9
結果● ランダムサンプルにおいても同様にSide Constraintsが有効である10
結論● 丁寧さの注釈を訓練の追加入力として統合してNMTの敬語生成を制御できる● 丁寧さがユーザに指定される前提であるが将来はソーステキストから自動的に予測することを目指す● 本稿では丁寧さの制御に焦点を当てているが、幅広い現象にSide Constraintsを適用できる可能性がある11