Literature
2
Title: Self-Supervised Neural Machine Translation
Authors: Dana Ruiter, Cristina España-Bonet, Josef van Genabith
Volume:
Proceedings of the 57th Annual Meeting of the Association for
Computational Linguistics
Pages: 1828–1834
Year: 2019
Selection process
• 以下の4つの戦略を検討する
• Ce, Chのいずれか、または両方利用
1. Threshold dependent
2. High precision, medium recall (System P)
3. Medium precision, high recall (System R)
4. Low precision, high recall
8
High precision, medium recall
• Threshold dependentとほとんど同じ
• Ch, Ceの両方の表現を用いる
• 両言語方向かつ両表現で一致したペアのみを用いる
• 補完的なCh, Ceによってしきい値は不要となる
10
Slide 11
Slide 11 text
Medium precision, high recall
• High precision, medium recallは制限が強い
• 最高スコアの目的言語文だけを用いるのではなく
top-n (本実験ではn=2) を用いるようにする
• 両方の表現を用いるのは同じだが、上の拡張は
Chにおいてのみ使用する
11
Slide 12
Slide 12 text
Low precision, high recall
• Medium precision, high recall における
source-targetとCh-Ce を対称にした手法
12