Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介15年08月

miyanishi
July 24, 2015
230

 文献紹介15年08月

miyanishi

July 24, 2015
Tweet

Transcript

  1. 文献情報 • Orthographic and Morphological Processing for Persian-to-English Statistical Machine

    Translation • Rasooli, Mohammad,et. al. • International Joint Conference on Natural Language Processing 2013 • P14-18 2
  2. ペルシア語の問題点 • ペルシア語の性や活用 – rich inflection な言語(接尾辞が多彩) – 形容詞 •

    比較的シンプルな活用 • 比較級・最上級などが活用の対象 – 名詞 • 形容詞を伴う名詞句は形容詞によって接尾辞が付属 – 動詞 • 時制やムードなど様々な理由で接尾辞が変化 • 100種類以上の動詞+接尾辞の形が存在 5
  3. 機械翻訳への反映 • 5つのパターンを用意 – Raw :特になにもしない – Raw-RS : 全通常スペースをセミスペースに変換

    – PerStem : PerStem解析器を使用 – Clean-SS : セミスペースの推定→校正 – VerbStem : 提案手法 10