文献紹介：Reference Network for Neural Machine Translation

Reference Network for Neural Machine Translation Han Fu, Chenghao Liu,
Jianling Sun Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 3002-3012, Florence, July 2019.

概要 - 訓練データの情報を生成時に参照する Reference Network を NMT に採用 - NIST、WMT
の翻訳タスクで従来の関連する手法を上回った 2

Reference Network - 先行研究: 最近翻訳した入力文-出力文の情報を保持する手法がいくつかあるが、保持できる文の量に制限がある - 本研究: 生成時に訓練データの情報を用いる
3

例：人間が翻訳する場合翻訳対象の文に訳すのが難しい単語/フレーズがあったら… 1. 翻訳しやすい単語/フレーズに言い換える ◦ (例: 日→英翻訳)「斟酌(しんしゃく)する」→？ ◦ 「斟酌する」→「考慮する」
2. 入力言語-対象言語の間で対応の取れた単語/ フレーズのリストを参照し、そこから用いる ◦ 「斟酌する」⇄ “consider” 4

提案手法以下の2つを提案 - Monolingual RefNet - 入力言語の翻訳が難しい単語/フレーズを言い換るための情報を訓練データから獲得できるように設計 - Bilingual
RefNet - 訓練データにおける、入力言語-対象言語の単語/フレーズの対応する情報を用いるように設計 5

Monolingual RefNet (M-RefNet) 6

Monolingual RefNet (M-RefNet) 7 NMT 

Monolingual RefNet (M-RefNet) 8 訓練データ (原文側)の情報を利用

Monolingual RefNet (M-RefNet) 9 Local Coordinate Coding (LCC) へ入力出力を文脈情報として
NMT へ渡す LCC: 訓練データの情報を直接保存するのは無理なので、意味情報を圧縮する手法

Bilingual RefNet (B-RefNet) 10

Bilingual RefNet (B-RefNet) 11 NMT 

Bilingual RefNet (B-RefNet) 12 ・原文の文脈情報 c t ・訳文の文脈情報 s t-1
・前回の出力 y t-1 を利用

Bilingual RefNet (B-RefNet) 13 訓練データの情報に基づいて参照可能な単語を提供

実験 2つの実験を行った(中国語-英語がメイン) - 中国語-英語 (Zh-En) 翻訳 - 既存手法と BLEU を比較
- 出力文を比較 - (付録) パラメータ数、学習/生成速度 - (付録) 出力文の BLEU/文長の分布 - 英語-ドイツ語 (En-De) 翻訳 - NMT の強いモデルと BLEU を比較 14

中国語-英語 (Zh-En) 翻訳 - データセット - 訓練データ: LCD2002-2005 (1.25M 文のペア)
- 開発データ: NIST MT02 - テストデータ: NIST MT05/06/08 - 提案手法の NMT 部分 - Seq2seq with attention - エンコーダ: 双方向 RNN - デコーダ: 一層の RNN 15

中国語-英語 (Zh-En) 翻訳 - 比較対象のモデル(既存手法) - CS-NMT (Wang et al.,
2017): デコーダに過去3つの対訳ペアの文ベクトル表現を用いる - LC-NMT (Jean et al., 2017): 今翻訳する文と過去に翻訳した文を同時にエンコードする - CC-NMT (Tu et al., 2018): 直近25文の翻訳履歴をメモリ形式で保存する - DC-NMT (Maruf and Haffari, 2018): CCの文書レベル 16

中国語-英語 (Zh-En) 翻訳 - 比較対象のモデル(既存手法) - CS-NMT (Wang et al.,
2017): デコーダに過去3つの対訳ペアの文ベクトル表現を用いる - LC-NMT (Jean et al., 2017): 今翻訳する文と過去に翻訳した文を同時にエンコードする - CC-NMT (Tu et al., 2018): 直近25文の翻訳履歴をメモリ形式で保存する - DC-NMT (Maruf and Haffari, 2018): CCの文書レベル 17 翻訳履歴をベクトル形式で保存翻訳履歴をメモリ形式で保存

英語-ドイツ語 (En-De) 翻訳 - データセット - 訓練データ: WMT14 (4.5M 文のペア)
- 開発データ: Newstest2012/2013 - テストデータ: Newstest2014 - 提案手法の NMT 部分 - Deep Linear Associative Unit model (DeepLAU) - GRU を拡張した LAU を用いたもの - エンコーダ、デコーダ共に4層 18

英語-ドイツ語 (En-De) 翻訳 - 比較対象のモデル(NMT の強いモデル) - GNMT: 8層の LSTM
から構成される Seq2seq - Robust NMT: 2層の GRU + 敵対的学習 - ConvS2S: 15層の CNN から構成される Seq2seq - Transformer (big): 6層、16つのヘッド 19

結果 (Zh-En) 20 RefNet を追加したことで BLEU が向上

結果 (Zh-En) 21 先行研究の結果も上回る

出力例 (Zh-En) 22 NMT で訳せなかった単語 “lichang” を訳せるようになった

出力例 (Zh-En) 23 NMT で未知語となるフレーズも RefNet ではうまく訳せている(訓練データにそういう対訳があった？)

結果 (En-De) 24 RefNet を用いる前は GNMT ~ ConvS2S に負けているが…

結果 (En-De) 25 RefNet を用いることで GNMT ~ ConvS2S を上回るようになった

結論 - 訓練データの情報を生成時に参照する Reference Network を NMT に採用 - NIST、WMT
の翻訳タスクで従来の関連する手法を上回った 26

参考文献(先行研究) - Longyue Wang, Zhaopeng Tu, Andy Way, and Qun
Liu. Exploiting cross-sentence context for neural machine translation. In Proc. of EMNLP, pp.2826-2831, 2017. - Sebastien Jean, Stanislas Lauly, Orhan Firat, and Kyunghyun Cho. Does neural machine translation benefit from larger context? arXiv preprint arXiv:1704.05135, 2017. - Zhaopeng Tu, Yang Liu, Shuming Shi, and Tong Zhang. Learning to remember translation history with a continuous cache. Trans. of ACL, 6:407-420, 2018. - Sameen Maruf and Gholamreza Haffari. Document context neural machine translation with memory networks. In Proc. of ACL, pp.1275-1284, 2018. 27

付録 28

パラメータ数、速度 (Zh-En) 29

出力文の品質と文長 (Zh-En) 30

文献紹介：Reference Network for Neural Machine Trans...

文献紹介：Reference Network for Neural Machine Translation

Taichi Aida

More Decks by Taichi Aida

Other Decks in Research

Featured

Transcript

Reference Network for Neural Machine Translation Han Fu, Chenghao Liu,

概要 - 訓練データの情報を生成時に参照する Reference Network を NMT に採用 - NIST、WMT

Reference Network - 先行研究: 最近翻訳した入力文-出力文の情報を保持する手法がいくつかあるが、保持できる文の量に制限がある - 本研究: 生成時に訓練データの情報を用いる

例：人間が翻訳する場合翻訳対象の文に訳すのが難しい単語/フレーズがあったら… 1. 翻訳しやすい単語/フレーズに言い換える ◦ (例: 日→英翻訳)「斟酌(しんしゃく)する」→？ ◦ 「斟酌する」→「考慮する」

提案手法以下の2つを提案 - Monolingual RefNet - 入力言語の翻訳が難しい単語/フレーズを言い換るための情報を訓練データから獲得できるように設計 - Bilingual

Monolingual RefNet (M-RefNet) 6

Monolingual RefNet (M-RefNet) 7 NMT

Monolingual RefNet (M-RefNet) 8 訓練データ (原文側)の情報を利用

Monolingual RefNet (M-RefNet) 9 Local Coordinate Coding (LCC) へ入力出力を文脈情報として

Bilingual RefNet (B-RefNet) 10

Bilingual RefNet (B-RefNet) 11 NMT

Bilingual RefNet (B-RefNet) 12 ・原文の文脈情報 c t ・訳文の文脈情報 s t-1

Bilingual RefNet (B-RefNet) 13 訓練データの情報に基づいて参照可能な単語を提供

実験 2つの実験を行った(中国語-英語がメイン) - 中国語-英語 (Zh-En) 翻訳 - 既存手法と BLEU を比較

中国語-英語 (Zh-En) 翻訳 - データセット - 訓練データ: LCD2002-2005 (1.25M 文のペア)

中国語-英語 (Zh-En) 翻訳 - 比較対象のモデル(既存手法) - CS-NMT (Wang et al.,