Slide 27
Slide 27 text
© DeNA Co., Ltd. 27
2nd Place Solution (ynktk さん)
● 概要:LightGBM, XGBoost, Catboost の結果を Ridge で stacking
● CV 戦略
○ ランダムに 10 fold に分割
● 特徴的な特徴量
○ anime2Vec (word2vec ベース)
■ anime_id や original_work_name を単語として userごとに document とし word2vec を適用
■ 事前にaired_start_dateでsort
■ userが作品を見た正確な日付は分からないためwindowは大きめに取る
○ anime2Vec(TalkingData 1st solutionベース)
■ user_idごとに視聴した作品を集めてdocumentとし、Vectorizerと次元削減の組み合わせを適用する
■ CountVectorizer x LatentDirichletAllocation, CountVectorizer x TruncatedSVD,
CountVectorizer x NMF, TfidfVectorizer x LatentDirichletAllocation,