Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介9月30日

miyanishi
September 30, 2014
320

 文献紹介9月30日

miyanishi

September 30, 2014
Tweet

Transcript

  1. 著者情報 • SimplerunsupervisedPOStaggingwithbilingual projections • Author: LongDuong et al. •

    Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics • Year: 2013 • Pages: 634–639 2
  2. 提案手法 • 教師なしの品詞タグ付与を提案 – ①Seed model – ②自己学習 • パラレルコーパスを使用

    – 豊富な言語(品詞タグ付き) – 貧困な言語 • ターゲットとなる言語 – 貧困な言語 6
  3. タグセット • 品詞タグは12種類 名詞 数詞 動詞 接続詞 形容詞 接頭辞・接尾辞 副詞

    句読点 代名詞 その他(外国語・・・) 決定詞・冠詞 前置詞・後置詞 • ユニバーサルに選択した12種類 7
  4. ②自己学習 1. ターゲット言語の文をブロックに分割 2. 最初のブロックにseed modelでタグ付与 3. タグが付いたブロックを修正 4. 修正済タグ付きブロックで新モデルを訓練

    5. seed modelの辞書に新モデルを追加 6. 5を使って次のブロックをタグ付与 7. 3に戻る(全ブロックにタグが付くまで) 12
  5. ②自己学習 1. ターゲット言語の文をブロックに分割 2. 最初のブロックにseed modelでタグ付与 3. タグが付いたブロックを修正 4. 修正済タグ付きブロックで新モデルを訓練

    5. seed modelの辞書に新モデルを追加 6. 5を使って次のブロックをタグ付与 7. 3に戻る(全ブロックにタグが付くまで) 13
  6. タグの修正 • ( | )>0.7 ならば を に置換 – :ターゲット言語の単語

    – :ソース言語の単語 – : に付いたタグ(seed model) – : に付いたタグ(リソース) • 0.7は発見的に決定 14