Dataset ・投稿されたレビュー数が50件以上 ・IMDbにメタデータを持つ 文書(映画)ID:1,000個 文書(映画レビュー)数:50,000件 総単語数:4,673,717語 メタデータ(映画ジャンル)数:22種類 映画1000本を使用 ハイパーパラメータ 値 分散表現の次元数 50 バッチサイズ 800 Negative Sampling数 5 Epoch数 10 window_size 5 ・計算の高速化のためにNegative Sampling ・学習初期の学習崩壊を防ぐ Sigmoid Anealing Scheduler を実装 各手法から得られるベクトルを対象に実験