Slide 23
Slide 23 text
22
実データを使用した比較手法の実験設定
・提案手法(ベクタライザ+ガイドタスク+KLD)
・KLD無しモデル(ベクタライザ+ガイドタスク)
・ガイドタスク無しモデル(ベクタライザ+KLD)
・ベースライン(単語予測のみのベクタライザ)
実データを使用した比較手法
データセット
Kaggleで公開されているIMDb Review Dataset
・投稿されたレビュー数が50件以上
・IMDbにメタデータを持つ
文書(映画)ID:1,000個
文書(映画レビュー)数:50,000件
総単語数:4,673,717語
メタデータ(映画ジャンル)数:22種類
映画1000本を使用
ハイパーパラメータ 値
分散表現の次元数 50
バッチサイズ 800
Negative Sampling数 5
Epoch数 10
window_size 5
・計算の高速化のためにNegative Sampling
・学習初期の学習崩壊を防ぐ
Sigmoid Anealing Scheduler を実装
各手法から得られるベクトルを対象に実験