Slide 9
Slide 9 text
条件付き確率による言語モデル
8
先頭から単語を順に生成する条件付き確率の積で表現する
𝑃𝑃 𝑦𝑦1
, … , 𝑦𝑦𝑇𝑇
= 𝑃𝑃 𝑦𝑦1
BOS 𝑃𝑃 𝑦𝑦2
BOS, 𝑦𝑦1
⋯ 𝑃𝑃 𝑦𝑦𝑇𝑇
BOS, … , 𝑦𝑦𝑇𝑇−1
テキストの続きを予測する問題
𝑃𝑃 英国, の, 首都, は, 𝑦𝑦 = 𝑃𝑃 英国 BOS 𝑃𝑃 の BOS, 英国 ⋯ 𝑃𝑃 は BOS, … , 首都 𝑃𝑃 𝑦𝑦 BOS, … , は
より、
𝑦𝑦∗ = argmax
𝑦𝑦∈𝑉𝑉
𝑃𝑃 英国, の, 首都, は, 𝑦𝑦 = argmax
𝑦𝑦∈𝑉𝑉
𝑃𝑃(𝑦𝑦|英国, の, 首都, は)
条件付き確率𝑃𝑃 𝑦𝑦𝑡𝑡
BOS, … , 𝑦𝑦𝑡𝑡−1
をどのように求めればよいか?
先頭の単語を生成
2番目の単語を生成
𝑇𝑇番目の単語を生成
𝑃𝑃 東京 | BOS, 英国, の, 首都, は = 0.08
𝑃𝑃 パリ |BOS, 英国, の, 首都, は = 0.01
𝑃𝑃 … … |BOS, 英国, の, 首都, は = ⋯
𝑃𝑃 ロンドン |BOS, 英国, の, 首都, は = 0.76
𝑦𝑦に何を当てはめても定数
𝑦𝑦∗ = ロンドン
計算された確率の最大値を与えるyを選択する