Slide 8
Slide 8 text
クロップに利
用
解法 - 画像分類アプローチ
Label as positive
{
“s0”: [211, 237],
“s1”: [178, 207],
...
}
1. 周波数帯の辞書作成
Label as negative
Train TP/FPのみを信頼し、明確にアノテーションがある部分だけを切り抜いて画像分類
Augmentations
* PitchShift
* Gain
* AddGaussianNoise
2. TP/FPのラベルの周波数帯を6秒分切り抜く
3. 画像サイズを揃える
320x320, 456x456など
4. EfficientNetを学習
Configurations
models: tf_efficientnet_b<0-5>_ns
loss: BCEFocalLoss
Optimizer: AdamW
Scheduler: Linear Warmup
Epochs: 60
KFold: MultilabelStratifiedKFold x 5
Checkpointing: Monitor F1 score
5. 6秒ずつ時間をずらしながら24種分の周波数帯を切り抜く
学習時
推論時
・・・
6. 画像サイズを揃える
7. 学習したモデルで推論
クロップに利
用
320x320, 456x456など
Single model Scores
Public LB: 0.92x ~ 0.935
Private LB: 0.92x ~ 0.931 8
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
6秒ごとの予測(24種)
種ごとにmax
を取る