Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Building_a_Monolingual_Parallel_Corpus_for_Text...

 Building_a_Monolingual_Parallel_Corpus_for_Text_Simplification_Using

文献紹介

katsutan

June 22, 2017
Tweet

More Decks by katsutan

Other Decks in Technology

Transcript

  1. Building a Monolingual Parallel Corpus for Text Simplification Using Sentence

    Similarity Based on Alignment between Word Embeddings Tomoyuki Kajiwara and Mamoru Komachi Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers, pages 1147–1158, Osaka, Japan, December 11-17 2016. 図、表などは論文中から引用しています。 1 自然言語処理研究室 B4 勝田 哲弘 2017/6/23
  2. 文の類似度 • Average Alignment • Maximum Alignment • Hungarian Alignment

    ▫ Song and Roth(2015) • Word Mover’s Distance ▫ (Kusner et al., 2015) 4
  3. 実験 類似度の計算 • English WikiediaとSimple English Wikipediaの ラベル付けされたデータを分類する ▫ Hwang

    et al.(2015) ▫ Good(277), Good Partial(281), Partial(117), Bad(67178) • 分類 ▫ Goodとそれ以外 ▫ Good+Good Partialとそれ以外 7
  4. 実験 コーパス • Maximum Alignmentを使用してコーパス構築 ▫ 単語類似度 0.49以上 ▫ 文類似度

    0.53以上 に設定 • English WikiediaとSimple English Wikipedia ▫ タイトルの一致をとって126,725記事のペアを取 得 • 126,725記事から492,993文の対が得られた • フレーズベースのSMTを用いて学習 11
  5. 12