Slide 17
Slide 17 text
候補: 約3万件
● 顧客に拠らず、直近5週
でアクティブな3万件
● GBDTより多量の候補を
少ない時間で推論可能
17
NNモデル改善 [CV: 0.0348~352, LB: 0.0298~0.0303]
①メタ情報埋め込みベクトルの導入(+α)
(CV:0.0254→0.0298)
⑤EfficientNet PCA, deepwalk, w2vの導入
(CV:0.0345→0.0352)
EfficientNet
+ PCA
②Likelihood dropout
(CV:0.0298→0.0306)
● 商品ID毎の1Dパラメータ(Likelihood)
は過学習しやすい
○ 初期値ゼロ、顧客に寄らない商品
の出現頻度が学習される
○ 訓練⇔検証・テストで頻度分布は
異なり、過学習に繋がりやすい
○ 検証・テストで初めて出現する
商品はゼロのままで、異常データ
になり得る
● 学習時にランダムに0を入力する
ことで性能改善
④Top2~5 features
(CV:0.0327→0.0345)
● 購買商品に対する特徴量を追加
○ その顧客の最終購入週の
何週前の購入か
○ 何週購入したか
○ 通算何点購入したか
● 類似度Top1 → Top2~5 を算出
③1e-2*DiceLoss
(CV:0.0306→0.0327)
● BCELoss, DiceLossの
スケールの違いを吸収