Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
Integrating Meaning into Quality Evaluation of Machine Translation Proceedings of EACL 2017, Vol. 1, Long Papers, pages 210-219. 1 文献紹介(2017/08/30) 自然言語処理研究室 稲岡 夢人
Slide 2
Slide 2 text
概要 ● 機械翻訳(MT)の品質はMTの出力と人間の 翻訳を比較して評価している ● 上のような評価は形式に関連した特徴 (語彙や文法)に依存し意味の伝達は無視 ● 意味に関連する特徴と他の評価指標を組み合 わせて人手評価を予測 2
Slide 3
Slide 3 text
既存手法の問題点 ● MTはよく意味を保持しない翻訳を行う ● BLEU, METEORはMTによる意味の変化を 直接考慮して評価していない 3
Slide 4
Slide 4 text
自動評価と人手評価の差 人手評価で最低の評価となった4文 1. badlyが消えて意味が失われている 2. 否定文が肯定文になっている 3. 不確かな情報を生成している 4. 形式が異なっている 4
Slide 5
Slide 5 text
自動評価と人手評価の差 ● MTの評価では主に語彙や文法に焦点を当て ている ● 下のような出力に高いスコアを与えやすい 5
Slide 6
Slide 6 text
本研究で行っていること ● 意味に関連する特徴が人手評価に影響を与 えるのかを調べる ● MTの評価における形式や意味に関連する特 徴を比較 ● 形式と意味に関連する特徴を組み合わせるこ とで既存の評価手法を改善できるか測定 6
Slide 7
Slide 7 text
意味に関連した特徴 ● Sentiment Polarity : 肯定, 否定的な感情 を持つか ● Subjectivity : 意見を表現するか ● Connotation : 文化, 感情的な連想 ● Negation : 肯定的記述を否定的に変化 ● Speculation : 確実性のレベルを表現 ● Readability : 文長, 音節数による可読性 ● Formality : 文が形式的であるか 7
Slide 8
Slide 8 text
個々の特徴が品質に与える影響 ● それぞれの特徴と人手評価の相関を調べる ● データセットはWMT15の目的言語が英語で あるものを使用 8
Slide 9
Slide 9 text
個々の特徴が品質に与える影響 9
Slide 10
Slide 10 text
個々の特徴が品質に与える影響 ● ベースラインより意味関連の特徴が上回る ● Formality-RBが最も相関の強い特徴 ● BLEU, METEOR, DPMFCombがそれより 強い相関を示す 10
Slide 11
Slide 11 text
複合の特徴が品質に与える影響 ● 意味に関する特徴を全て用いて利用 ● 意味に関する特徴全てとBLEU, METEOR, DPMFCombを組み合わせて利用 ● 上のアンサンブルシステムの構築には RandomForestと呼ばれる手法を用いる 11
Slide 12
Slide 12 text
複合の特徴が品質に与える影響 12
Slide 13
Slide 13 text
複合の特徴が品質に与える影響 ● 意味に関連する特徴を複合したものは BLEUより優れている ● それをBLEU, METEOR, DPMFcombと 組み合わせるとさらに性能が向上 ● 従来の評価手法がこれらの特徴を 補足できていないことを意味している 13
Slide 14
Slide 14 text
結論 ● 人手評価によって高評価なMTシステムは 意味に関連した特徴を保持する ● 意味に関連した特徴を用いた評価は 人手評価と高い相関を示す ● 既存の評価手法と組み合わせることで より正確に人手評価を予測できる 14