B3勉強会　第2回　N-gramの紹介

B3勉強会第2回 2016年１月14日 N-gramの紹介自然言語処理研究室 B3 LY NAM PHONG

はじめに • 参考文献１．自然言語処理の基礎奥村学著２．https://class.coursera.org/nlp/lecture/14 • 内容
• １．言語モデル • ２．N-gramモデル

言語モデル • 言語モデルとは、テキストにおける確率ということである。 • 例えば、P(hôm nay trời đẹp) > P(trời
đẹp hôm nay) (Pは確率と考えられる） • 言語モデルは自然言語処理の中にいろいろな地域を応用している、機械翻訳、スペルチェックとか。 • 機械翻訳 ➢ P(high winds tonight) > P(large winds tonight) • スペルチェック ➢ The office is about 15 minuets from my house. ➢ P(about 15 minutes) > P(about 15 minuets)

言語モデル • 言語モデルの目的は文字の確率を計算することである。 • P(W) = P(w 1 ,w 2
,w 3 ,...,w k ) • 関係のタスク：次の言葉の確率を計算する。 • P(w k |w 1 ,w 2 ,w 3 ,w 4 ,...,w k-1 ) • Bayes法則: P(w 1 w 2 w 3 ...w k )=P(w 1 )*P(w 2 |w 1 )*P(w 3 |w 1 w 2 )*...*P(w k |w 1 w 2 ..w k-1 ) • 例：確率P(“Today is Monday”)を計算する。 • Bayes法則に基づく、下の式に示す。 • P(“Today is Monday”)=P(Today)*P(is|Today)*P(Monday|Today is) • => 普通のは、ｎの値がすごく大きいから、計算できない！

N-gramモデル • Markov仮定を用いて、確率は近似値を計算できる。 • P(w k |w 1 ,w 2
,...w k-1 )≒P(w k |w k-n ,...,w k-1 ) =>文字ｋの確率はｎ文字前から得られる。これはN-gramモデルと言われている。 • 例：1-gram (unigram): P(w 1 w 2 ...w k )≒P(w 1 )*P(w 2 )*...*P(w k ) • 2-gram (bigram): P(w 1 w 2 ...w k )≒P(w 1 )*P(w 2 |w 1 )*...*P(w k |w k-1 ) • 3-gram (trigram): P(w 1 w 2 ...w k )≒P(w 1 )*P(w 2 |w 1 )*P(w 3 |w 1 ,w 2 )*...*P(w k |w k-2 ,w k-1 ) • N-gramの問題点： – 実は、言語が長距離の依存関係であるので、違う意味の場合もある。 • 例：The computer which I had just put into the machine room on 5th floor crashed.

計算例 • 1-gramで、下の場合はどちらの確率値が一番高い？ • P(I like ice cream) • P(the
the the the) • P(I go to class daily) • P( I daily go to class)

計算例 • 下のような５文からなる英語の品詞タグ付コーパスを考え、P(N|Det)とP(V|Det)を計算しなさい。 A/Det cat/N sat/V on/P the/Det mat/N.
A/Det girl/N read/V a/Det book/N. Boys/N play/V baseball/N. A/Det train/N runs/V. A/Det dog/N chases/V a/Det cat/N.

計算例 P(N|Det) = C(Det,N)/C(Det) = 7/7 = 1 P(V|Det) =
C(Det,V)/C(Det) = 0/7 = 0 (Cは頻度を表すことにする）

B3勉強会　第2回　N-gramの紹介

B3勉強会　第2回　N-gramの紹介

phong3112

More Decks by phong3112

Featured

Transcript

B3勉強会第2回 2016年１月14日 N-gramの紹介自然言語処理研究室 B3 LY NAM PHONG

はじめに • 参考文献１．自然言語処理の基礎奥村学著２．https://class.coursera.org/nlp/lecture/14 • 内容

言語モデル • 言語モデルとは、テキストにおける確率ということである。 • 例えば、P(hôm nay trời đẹp) > P(trời

言語モデル • 言語モデルの目的は文字の確率を計算することである。 • P(W) = P(w 1 ,w 2

N-gramモデル • Markov仮定を用いて、確率は近似値を計算できる。 • P(w k |w 1 ,w 2

計算例 • 1-gramで、下の場合はどちらの確率値が一番高い？ • P(I like ice cream) • P(the

計算例 • 下のような５文からなる英語の品詞タグ付コーパスを考え、P(N|Det)とP(V|Det)を計算しなさい。 A/Det cat/N sat/V on/P the/Det mat/N.

計算例 P(N|Det) = C(Det,N)/C(Det) = 7/7 = 1 P(V|Det) =

B3勉強会 第2回 N-gramの紹介

B3勉強会 第2回 N-gramの紹介

More Decks by phong3112

Featured

Transcript

B3勉強会　第2回　N-gramの紹介

B3勉強会　第2回　N-gramの紹介