Slide 14
Slide 14 text
1: TPラベル(正例)
0: 曖昧なラベル(正例が混じっている )
-1: FPラベル(負例)
mask loss
trainデータにはmissing labelがあるため負例ラベル (0)にも実際には正例(1)が含まれる
ex) 5クラスの場合
label = [ 0, 1, 0, 0, -1]
pred = [ 0.2, 0.8, 0.4, 0.1, 0.3]
TPラベルは1として学習
FPラベルは0として学習
0のところはmaskする(lossを計算しない)
以下の3つにラベルを分解
効果
- 曖昧なラベルをmaskして学習しないことで隠れた正例データを負例と学習しなくて済む
- FPデータを0ラベルとは別で扱うことで学習に使用することができる
- 最初はstage1で導入したが学習効率が悪くスコアも伸びなかったので、 stage2として少ないepochで学習し
たところLB scoreが+0.05