kaggle BYUコンペ振り返り~kaggle初心者がshake Downした話~

BYUコンペ参加振り返り・解法共有 shiba-inu

2/• SSS システムソリューション事業部   メダル0

3/• SSS システムソリューション事業部メダル0

4/• SSS システムソリューション事業部      Å(10^-10 m)
     Trainにおける3Dデータ内に存在する物体の数の分布 Z:300~800 X, Y:900~1900 x0 x1 x2~10 全データセットで70GB (400, 500, 600)

5/• SSS システムソリューション事業部   Å OK メダル0 OK NG

6/• SSS システムソリューション事業部

7/• SSS システムソリューション事業部メダル0 汚いラベルのコンペ開いてくれてありがとう実際のラベル (z=120, x=600, y=700) 本当は…
→物体が存在しない領域を学習してしまう可能性

8/• SSS システムソリューション事業部    物体学習に使用するスライス画像学習推論
検知！(200,300,300)

9/• SSS システムソリューション事業部      

10/• SSS システムソリューション事業部モデル作成  学習データ作成(公式データセット+ 外部データセットの一部)  物体が存在するスライス画像の前後±4枚の画像を使用 
ラベル修正(1回目)実施：自前で学習したYoloで閾値が中間の物体を対象  モデル：YoLo  Version：MHAF-YoLo(m-size) (様々な物体検知が得意)  解像度：640 x 640  使用した学習パラメータ(Mosaic: 1, Mixup:0.3, resize:x0.1~1.9  valデータにおけるF2scoreが最大なcheckpointを採用  学習時の工夫今回与えられるラベルは中心点のみのため、多くの人が幅高さのラベルとして定数を設定。→データ拡張(resize, rotation)により幅高さが大きく変動し、モデルが混乱する可能性 (x,y) w h 推論 ① 前処理 ① 前後±1枚の画像を用いて平均 ② Percentile Normを実施 ② Yoloで推論 ③ 後処理(全スライスの推論が完了した後) ① 全スライス推論で検出された位置を記録 ② 連続5枚、同じ位置に検出された場合、採用! →FP対策に大きく貢献採用！破棄 (x,y) 20 20 破棄：精度向上に貢献 mba*.jpg ycw*.jpg aba*.jpg

11/• SSS システムソリューション事業部モデル作成  3DCNN(セマセグ) with Monai  2dCNN(Yolo)
 複数version(v5,8,9,11,)  モデルサイズ(M, L, X)  解像度変更(640, 960, 1280)  ラベル修正2回目  物体が存在するスライス全画像5000枚修正(CVAT) 推論  前処理  ヒストグラム平均化  Percentile Normなし  TTA  後処理  maxのみを取得

12/• SSS システムソリューション事業部    GPU CPU ※MultiGPU推論による高速化を試すも、突如学習が始まるおそろしいバグが発生したため断念(今回使用した非公式Yoloライブラリによるバグ?)

13/• SSS システムソリューション事業部高速化 8枚 8枚 8枚 8枚 8枚 8枚
… … … …

14/• SSS システムソリューション事業部閾値 PublicLB 0.55 0.86 0.60 0.84 閾値
自分のAI 提出時、閾値少しずらすだけで LBに大きな変化が数回発生理想のAI Publicとデータ分布が異なっても精度影響小データ分布が変化した場合精度に大きな影響が… 閾値によりLB変化 →分離できていない可能性大? Public Private shake-upを科学する - Speaker Deck を参考にして考察してみる

15/• SSS システムソリューション事業部閾値 PublicLB 0.55 0.86 0.60 0.84 閾値
自分のAI 閾値少しずらすだけでLBに大きな変化理想のAI Publicとデータ分布が異なっても精度影響小データ分布が変化した場合精度に大きな影響が… 閾値によりLB変化 →分離できていない可能性大? Public Private 閾値調整した際、LBに大きな数値変化があったら注意が必要かも ??

16/• SSS システムソリューション事業部順位モデル外部データ
ラベル修正工夫高速化 1 3DUnet x 8 ✓ ✓ かなり強いaug(mixup, cutmix)。全データアノテーション学習：GPUによるAug 2 2dUnet x 1 ✓ ✓ ｾﾏｾｸﾞ特化最適化ライブラリnnUnet を使用(医療画像で多用) 3 3DUnet x3 2DViT x 2 ✓ ✓ CV連携しないため、全データで学習 4 3DUnet x 1 2.5D_Det x 4 ✓ × 強い3DAug(mixup等)を独自実装学習：GPUによるAug 推論：JiT+TensorRT(x2倍)

kaggle BYUコンペ振り返り~kaggle初心者がshake Downした話~

kaggle BYUコンペ振り返り~kaggle初心者がshake Downした話~

shiba

Other Decks in Science

Featured

Transcript

BYUコンペ参加振り返り・解法共有 shiba-inu

2/• SSS システムソリューション事業部   メダル0

3/• SSS システムソリューション事業部メダル0

4/• SSS システムソリューション事業部      Å(10^-10 m)

5/• SSS システムソリューション事業部   Å OK メダル0 OK NG

6/• SSS システムソリューション事業部

7/• SSS システムソリューション事業部メダル0 汚いラベルのコンペ開いてくれてありがとう実際のラベル (z=120, x=600, y=700) 本当は…

8/• SSS システムソリューション事業部    物体学習に使用するスライス画像学習推論

9/• SSS システムソリューション事業部      

10/• SSS システムソリューション事業部モデル作成  学習データ作成(公式データセット+ 外部データセットの一部)  物体が存在するスライス画像の前後±4枚の画像を使用 

11/• SSS システムソリューション事業部モデル作成  3DCNN(セマセグ) with Monai  2dCNN(Yolo)

12/• SSS システムソリューション事業部    GPU CPU ※MultiGPU推論による高速化を試すも、突如学習が始まるおそろしいバグが発生したため断念(今回使用した非公式Yoloライブラリによるバグ?)

13/• SSS システムソリューション事業部高速化 8枚 8枚 8枚 8枚 8枚 8枚

14/• SSS システムソリューション事業部閾値 PublicLB 0.55 0.86 0.60 0.84 閾値

15/• SSS システムソリューション事業部閾値 PublicLB 0.55 0.86 0.60 0.84 閾値

16/• SSS システムソリューション事業部順位モデル外部データ