Baseline model architecture
・工夫点はAugmentationの組み合わせだと思っていた!
Slide 12
Slide 12 text
めっちゃシェイクダウン😇
Public : 18位
Private : 213位 (- 195位)
Slide 13
Slide 13 text
何がいけなかった...?
Public / Privateには未知のGraphemeが含まれていた。
訓練データには1295種類のGraphemeしかないが、実際にはもっとある。
可能性的には168 x 11 x 7 = 12936種類のGraphemeが存在する。
Graphem root Vowel diacritic Consonant diacritic
実際
訓練
Slide 14
Slide 14 text
起こりうる部首の組み合わせを学習していた
● 学習が進むに連れて訓練に含まれる
Grapheme(実線、Seen)については精度が上がっていくが、訓練に存在
しないGraphem(破線、Unseen)については学習を進めるとどんどん下がっていってる。
Accuracy Loss
0.6
0.9
訓練に存在しないGraphem
Slide 15
Slide 15 text
特にユニークだった1位の解法
1. CycleGANを使ってInput画像をフォント調に変換し、
Unseen
Class Modelで予測
2. 「Seen」の場合、Seen Class Modelで最終スコアを予測
3. 「Unseen」の場合、Out of Distribution Detection Modelで
Seen Graphemeかどうかを再計算
4. 「Seen」の場合、Seen Class Modelで最終スコアを予測
5. 「Unseen」の場合、Out of Distribution Detection Modelの
予測値を最終スコアとする