Slide 12
Slide 12 text
3.3 Multiplicative weights for vocabulary sparsification
12
・ベイジアンスパース化の利点は,グループ(層)ごとの
スパース化に拡張できる.
・入力のone-hot ベクトルに確率的重み ∈ をかける
・ はミニバッチごとに重み同様に因子分解された正規分布で近似
・トレーニング後, の要素が低いものをθとσの比率をもとに
削除し,その語彙に対応する単語を使用せず,重み行列から
該当する行を削除.