Slide 18
Slide 18 text
損失関数:自己回帰的な生成のためのペナルティ項を導入
17
𝜆ce
ℒce
𝒚𝑡+𝑘
, 𝑝 ෝ
𝒚𝑡+𝑘
𝜆∗
:重み(ハイパーパラメータ)
4種類の損失の和を利用
𝜆corr
ℒcorr
𝜆iwp
ℒiwp
𝑦𝑡+𝑘,1
, 𝑝 ෝ
𝒚𝑡+𝑘,1
𝜆mse
ℒmse
𝒙𝑡+𝑘
, 𝒛𝑡+𝑘
• initial word penalty
1単語目が誤りであることに対しての
ペナルティ
ℒiwp
𝑦𝑡+𝑘,1
, 𝑝 ෝ
𝒚𝑡+𝑘,1
= 𝛾iwp
ℒce
𝒚𝑡+𝑘,1
, 𝑝 ෝ
𝒚𝑡+𝑘,1
𝛾iwp: 各単語の出現回数の逆比