Upgrade to Pro — share decks privately, control downloads, hide ads and more …

B3勉強会 第9回 言語モデルの評価

phong3112
March 01, 2016
98

 B3勉強会 第9回 言語モデルの評価

phong3112

March 01, 2016
Tweet

Transcript

  1. 参考文献  SPEECH AND LANGUAGE PROCESSING – Daniel Jurafsky &

    James H. Martin Pearson International Edition, 2nd Edition, pp. 129 – 131  Natural Language Processing online course by Dan Jurafsky, Christopher Manning, Stanford University https://class.coursera.org/nlp/lecture/129
  2. Perplexityの直感的  Shannonのゲーム:文の次の言葉を予測する  I always order pizza with cheese

    and …..  I saw a ….  良いモデルなら、このゲームはいい言葉が予測できる。 → 高い確率値をあげる。
  3. Perplexity  Perplexityとはテストセットの確率値を文の長さで正規化する。 = (1 2 3 … )− 1

    = =1 1 ( |1 … −1 )  Bigram: = =1 1 ( |−1 )  以上の式で、一番良いモデルは、Perplexity PPが一番低い値であることが分 かった。