Upgrade to Pro — share decks privately, control downloads, hide ads and more …

kaggle BYUコンペ振り返り~kaggle初心者がshake Downした話~

Avatar for shiba shiba
August 07, 2025

kaggle BYUコンペ振り返り~kaggle初心者がshake Downした話~

BYU - Locating Bacterial Flagellar Motors 2025コンペに参加したので、その振り返り共有します。
次こそ初メダルとりたい!

Avatar for shiba

shiba

August 07, 2025

Other Decks in Science

Transcript

  1. 4/• SSS システムソリューション事業部      Å(10^-10 m)

         Trainにおける3Dデータ内に存在 する物体の数の分布 Z:300~800 X, Y:900~1900 x0 x1 x2~10 全データセットで70GB (400, 500, 600)
  2. 10/• SSS システムソリューション事業部 モデル作成  学習データ作成(公式データセット+ 外部データセットの一部)  物体が存在するスライス画像の前後±4枚の画像を使用 

    ラベル修正(1回目)実施:自前で学習したYoloで閾値が中間 の物体を対象  モデル:YoLo  Version:MHAF-YoLo(m-size) (様々な物体検知が得意)  解像度:640 x 640  使用した学習パラメータ(Mosaic: 1, Mixup:0.3, resize:x0.1~1.9  valデータにおけるF2scoreが最大なcheckpointを採用  学習時の工夫 今回与えられるラベルは中心点のみのため、多くの人が幅高さのラベルと して定数を設定。→データ拡張(resize, rotation)により幅高さが大き く変動し、モデルが混乱する可能性 (x,y) w h 推論 ① 前処理 ① 前後±1枚の画像を用いて平均 ② Percentile Normを実施 ② Yoloで推論 ③ 後処理(全スライスの推論が完了した後) ① 全スライス推論で検出された位置を記録 ② 連続5枚、同じ位置に検出された場合、採用! →FP対策に大きく貢献 採用! 破棄 (x,y) 20 20 破棄 :精度向上に貢献 mba*.jpg ycw*.jpg aba*.jpg
  3. 11/• SSS システムソリューション事業部 モデル作成  3DCNN(セマセグ) with Monai  2dCNN(Yolo)

     複数version(v5,8,9,11,)  モデルサイズ(M, L, X)  解像度変更(640, 960, 1280)  ラベル修正2回目  物体が存在するスライス全画像5000枚修正(CVAT) 推論  前処理  ヒストグラム平均化  Percentile Normなし  TTA  後処理  maxのみを取得
  4. 14/• SSS システムソリューション事業部 閾値 PublicLB 0.55 0.86 0.60 0.84 閾値

    自分のAI 提出時、閾値少しずらすだけで LBに大きな変化が数回発生 理想のAI Publicとデータ分布が異なっても 精度影響小 データ分布が変化した場合 精度に大きな影響が… 閾値によりLB変化 →分離できていない可能性大? Public Private shake-upを科学する - Speaker Deck を参考にして考察してみる
  5. 15/• SSS システムソリューション事業部 閾値 PublicLB 0.55 0.86 0.60 0.84 閾値

    自分のAI 閾値少しずらすだけでLBに 大きな変化 理想のAI Publicとデータ分布が異なっても 精度影響小 データ分布が変化した場合 精度に大きな影響が… 閾値によりLB変化 →分離できていない可能性大? Public Private 閾値調整した際、LBに大きな数値変化があったら注意が必要かも ??
  6. 16/• SSS システムソリューション事業部 順 位 モデル 外 部 デー タ

    ラベ ル 修正 工夫 高速化 1 3DUnet x 8 ✓ ✓ かなり強いaug(mixup, cutmix)。 全データアノテーション 学習:GPUによるAug 2 2dUnet x 1 ✓ ✓ セマセグ特化最適化ライブラリnnUnet を使用(医療画像で多用) 3 3DUnet x3 2DViT x 2 ✓ ✓ CV連携しないため、全データで学習 4 3DUnet x 1 2.5D_Det x 4 ✓ × 強い3DAug(mixup等)を独自実装 学習:GPUによるAug 推論:JiT+TensorRT(x2倍)