#22 CA × atmaCup 3rd 1st Place Solution

©Commune Inc. | 1 #22 CA × atmaCup 3rd :||
1st Place Solution 2026/1/9 Yuki Mizuta / yumizu

©Commune Inc. | 2 Yuki Mizuta / yumizu 経歴 •
~2024：鉄道会社 Data Scientist • 2025~：Commune.inc Data Scientist SNS • X：@yumizzzz Favorite • 関西 / オカメインコ / コーヒー / 阪神タイガース　

©Commune Inc. | 3 #22 CA × atmaCup 3rd :||
引用：https://www.guruguru.science/competitions/30/data-sources

©Commune Inc. | 4 trainデータとtestデータで大きな違いがあった • ラベルが付与された選手（label_id = 0~10） •
バスケットコート全体の背景 • Ground TruthなBBox座標 • ラベル付与された選手 + 学習データに存在しない選手 • BBox領域が切り抜かれた画像 • 正確ではないBBox（選手が写っていない可能性有り） train test #22 CA × atmaCup 3rd :||

©Commune Inc. | 5 結果 Public / Private の両方で1位を獲得 🎉🎉

©Commune Inc. | 6 解法紹介

©Commune Inc. | 7 全体パイプライン

©Commune Inc. | 8 1st Stage：ArcFaceによる人物判定 ArcFaceにて11クラス分類（label_id=0~10）を実施 • StratifiedGroupKFold
5Fold • top / side でモデルを分割 • ArcFace ◦ backbone：Swin Transformer small, convnext small, efficientnetv2 small ◦ loss：Dynamic Margin • Dataset ◦ Augmentation：BBoxをx/y方向のシフト & height/widthの拡大縮小 • logits（= 各ラベルの代表ベクトルとのcosine類似度）を後続の予測に使用 backbone (Stage1) Public LB Private LB swin_small_patch4_window7_224 0.8191 0.8283 convnext_small.in12k_ft_in1k 0.8145 0.8194 tf_efficientnetv2_s 0.8064 0.8144 ※ この時点では予測値に label_id=-1が存在しないためスコアは低い

©Commune Inc. | 9 1st Stage：ArcFaceによる人物判定 top / sideでモデルを分割した理由 •
top / side を分離せず1つのラベルで学習し、 embeddingを可視化すると、1つのラベル内で 2つのクラスタに分離された • 学習やconsine類似度の取得に悪影響が及ぼす気がしたので、別のモデルに分離したそこまで気にする必要はなかったかも ...

©Commune Inc. | 10 1st Stage：ArcFaceによる人物判定 BBoxのxy方向シフト & 拡大縮小を行い、テストデータの BBoxを疑似的に再現
1. BBoxをランダムにシフト・拡大縮小 2. 以下の条件を全て満たす場合は採用。1つでも満たさない場合は1に戻って作り直し a. 元のbboxとのIoUが0.5以上 b. 元bboxとのIoU > max(他bboxとIoU）生成されるbboxと元のbboxのIoU値分布（シミュレーション結果）

©Commune Inc. | 11 2nd Stage：IoU回帰予測モデル与えられたBBox画像に対して、GroundTruthのBBoxとのIoUを予測する回帰モデルを作成 • top /
side でモデルを分割 • IoU値回帰予測モデル (0~1) ◦ Backbone：eﬃcientnetv2 small • Dataset ◦ Augmentation：BBoxをx/y方向のシフト & height/widthの拡大縮小

©Commune Inc. | 12 2nd Stage：IoU回帰予測モデル BBoxのxy方向シフト & 拡大縮小を行い、テストデータの BBoxを疑似的に再現
1. BBoxをランダムにシフト・拡大縮小 2. 元のbboxとのIoUを計算 a. IoU 0.5 以上：採用 b. IoU 0.5 未満：同一フレームの他BBoxとのIoUを全て0.5未満なら採用生成されるbboxと元のbboxのIoU値分布（シミュレーション結果）

©Commune Inc. | 13 2nd Stage：IoU回帰予測モデル unknown判定するためのIoU閾値を調整することで大幅にスコアが向上した • IoU回帰モデル作成時のBBox変更方法やIoU予測精度に問題があり、テストデータのIoUを正確に予測できていなかった可能性...
◦ IoUの大小関係は学習できていたので、閾値調整で精度が向上した • IoU閾値0.3がPubilc/Privateともベストスコアとなった ◦ テストデータのちょうど10%をunknownに補正していた backbone (Stage1) IoU閾値 Public LB Private LB swin_small_patch4_window7_224 0.5 0.8514 0.8527 swin_small_patch4_window7_224 0.4 0.9049 0.9046 swin_small_patch4_window7_224 0.3 0.9149 0.9122

©Commune Inc. | 14 3rd Stage：最適化 [0.8570] ⇒ [0.9549] かなり精度が上がるかもしれない個数制約付き最大化による後処理
とほぼ同じ以下の2条件のみ追加 • 1フレーム内において各label_idの割当は基本1回までだが、IoU > 0 の BBox ペアに限り同一ラベル付与可 • label_id=0, 8 と判定されたbboxは最後に全てlabel_id=-1に置換 backbone (Stage1) IoU閾値（Stage2） Public LB Private LB swin_small_patch4_window7_224 0.3 0.9511 0.9561 convnext_small.in12k_ft_in1k 0.3 0.9498 0.9528 tf_eﬃcientnetv2_s 0.3 0.9462 0.9500

©Commune Inc. | 15 スコア推移最適化追加 3-stage制に変更 Swin Transformerに変更 epoch数増加
IoU閾値調整

©Commune Inc. | 16 よかったところ（何故優勝できたか？）

©Commune Inc. | 17 よかったところ（何故優勝できたか？） 1. DiscussionのBaselineから仮説を立て、早期にコンペの特徴を把握できた 2. 問題や課題を整理・分解し、モデル構造や検証計画に上手く落とし込めた

©Commune Inc. | 18 1. DiscussionのBaselineから仮説を立て、早期にコンペの特徴を把握できた 1. CVはかなり高い ◦ 学習データに存在する選手の特定は結構簡単かも？
引用：RedBullさんの[0.8448]baseline notebookより

©Commune Inc. | 19 2. 基本的に1フレーム1ラベルの制約があるが、予測頻度は均一ではない ◦ 同一ラベルを重複して予測しているので、上手く制約を設けたい ◦ atmaCup#12でtuboさんが公開した後処理を思い出す（takaitoさんが後にdiscussionで共有）
1. DiscussionのBaselineから仮説を立て、早期にコンペの特徴を把握できた引用：RedBullさんの[0.8448]baseline notebookより

©Commune Inc. | 20 3. テストデータに対する予測において、 label=0, 8 の予測頻度は圧倒的に少ない ◦
テストデータには、label=0, 8 の選手は出場していない？ 1. DiscussionのBaselineから仮説を立て、早期にコンペの特徴を把握できた引用：RedBullさんの[0.8448]baseline notebookより

©Commune Inc. | 21 3つの気付きをもとに、早々に高スコアを獲得することができた ※ Restart前 1. RedBullさんの[0.8448]baseline notebook同様にモデルを学習
2. 個数制約付き最大化による後処理を行う 3. label=0, 8 と予測した画像はunknown（label_id=-1に置換） 1. Discussionのbaselineを見て仮説を立てる

©Commune Inc. | 22 2. 問題や課題を整理・分解し、モデル構造や検証計画に上手く落とし込めたコンペ中盤、上位10位以内に位置していたが、 1位との差は大きかった。 atmaCupに割ける時間や画像モデル学習時間を考え、少し焦り始めていた ...

©Commune Inc. | 23 2. 問題や課題を整理・分解し、モデル構造や検証計画に上手く落とし込めた一度冷静にコンペのタスクを整理・分解し、各タスクの予測精度と工数を整理してみたタスク予測精度学習・推論時間
備考 1. 　学習データに存在する選手を当てる ◎ ✕ ・Restart前LBやCVより予測は簡単・簡単なタスクだが、学習時間はかかる 2. 　BBox内に選手がいないことを当てる △ ✕ ・画像からIoUを正確に予測するのは難しい・BBoxのシフトがtestデータを再現できているか不明 3. 学習データに存在しない選手を当てる ◎ ◎ ・Restart前LBやCVより予測は簡単・label_id=0, 8を-1に置換 4. バスケットボール特有の制約を適用する〇〇・伸びしろ大。繰り返し実装 →検証が可能・あくまで後処理。1~3の精度が良い必要が前提。

©Commune Inc. | 24 タスク予測精度学習・推論時間備考 1. 　学習データに存在する選手を当てる
◎ ✕ ・Restart前LBやCVより予測は簡単・簡単なタスクだが、学習時間はかかる 2. 　BBox内に選手がいないことを当てる △ ✕ ・画像からIoUを正確に予測するのは難しい・BBoxのシフトがtestデータを再現できているか不明 3. 学習データに存在しない選手を当てる ◎ ◎ ・Restart前LBやCVより予測は簡単・label_id=0, 8を-1に置換 4. バスケットボール特有の制約を適用する〇〇・伸びしろ大。繰り返し実装 →検証が可能・あくまで後処理。1~3の精度が良い必要が前提。 2. 問題を上手く因数分解して実装に落とし込めた一度冷静にコンペのタスクを分解し、各タスクの予測精度と工数を整理してみた 3つはRestart前から存在する条件 → そこまで難易度は高くない 2を改善すればRestart前の高スコアを再現できるかも？

◎ ✕ ・Restart前LBやCVより予測は簡単・簡単なタスクだが、学習時間はかかる 2. 　BBox内に選手がいないことを当てる △ ✕ ・画像からIoUを正確に予測するのは難しい・BBoxのシフトがtestデータを再現できているか不明 3. 学習データに存在しない選手を当てる ◎ ◎ ・Restart前LBやCVより予測は簡単・label_id=0, 8を-1に置換 4. バスケットボール特有の制約を適用する〇〇・伸びしろ大。繰り返し実装 →検証が可能・あくまで後処理。1~3の精度が良い必要が前提。 2. 問題を上手く因数分解して実装に落とし込めた一度冷静にコンペのタスクを分解し、各タスクの予測精度と工数を整理してみたここをなんとか精度上げたい。モデル学習が必要だったり、後処理にも影響するので早めに固めたい

◎ ✕ ・Restart前LBやCVより予測は簡単・簡単なタスクだが、学習時間はかかる 2. 　BBox内に選手がいないことを当てる △ ✕ ・画像からIoUを正確に予測するのは難しい・BBoxのシフトがtestデータを再現できているか不明 3. 学習データに存在しない選手を当てる ◎ ◎ ・Restart前LBやCVより予測は簡単・label_id=0, 8を-1に置換 4. バスケットボール特有の制約を適用する〇〇・伸びしろ大。繰り返し実装 →検証が可能・あくまで後処理。1~3の精度が良い必要が前提。 2. 問題を上手く因数分解して実装に落とし込めた一度冷静にコンペのタスクを分解し、各タスクの予測精度と工数を整理してみた当時1つのモデルで両方を予測していた → 2の精度向上を目的に、予測精度が良い 1を学習するのは時間が勿体ない → モデルを分割して2の改善に注力することに

◎ ✕ ・Restart前LBやCVより予測は簡単・簡単なタスクだが、学習時間はかかる 2. 　BBox内に選手がいないことを当てる △ ✕ ・画像からIoUを正確に予測するのは難しい・BBoxのシフトがtestデータを再現できているか不明 3. 学習データに存在しない選手を当てる ◎ ◎ ・Restart前LBやCVより予測は簡単・label_id=0, 8を-1に置換 4. バスケットボール特有の制約を適用する〇〇・伸びしろ大。繰り返し実装 →検証が可能・あくまで後処理。1~3の精度が良い必要が前提。 2. 問題を上手く因数分解して実装に落とし込めた一度冷静にコンペのタスクを分解し、各タスクの予測精度と工数を整理してみた・最適化に要する時間は数分～数十分程度。コンペ終了最終日でも改善可能・画像分類モデルの精度や傾向次第なところもある → 後回しでよさそう

©Commune Inc. | 30 • 運が良かったです ◦ たまたま早期にコンペを理解でき、シンプルなアプローチでも上位に入れた • label_id
= 0, 8の置換はできればやりたくなかった ◦ ただ強力すぎたので使用させてもらった • 完全 Vibe Codingでした ◦ Cursor Pro プラン ▪ メイン：Claude Opus 4.5 ▪ サブ：GPT-5.2, Composer1 ◦ 指示を出すと、ほぼ100%完璧に実装してくれ、爆速で仮説検証のサイクルを回せた ▪ 人にとっては、今一番コンペが楽しいかもしれません ◦ 本コンペ時点では、人間のアイデアや指示無しで上位に入るのはまだ難しいかも ▪ 私のVibe Codingの環境がイケていないだけかも ... まとめ

#22 CA × atmaCup 3rd 1st Place Solution

#22 CA × atmaCup 3rd 1st Place Solution

yumizu

More Decks by yumizu

Other Decks in Technology

Featured

Transcript

©Commune Inc. | 1 #22 CA × atmaCup 3rd :||

©Commune Inc. | 2 Yuki Mizuta / yumizu 経歴 •

©Commune Inc. | 3 #22 CA × atmaCup 3rd :||

©Commune Inc. | 4 trainデータとtestデータで大きな違いがあった • ラベルが付与された選手（label_id = 0~10） •

©Commune Inc. | 5 結果 Public / Private の両方で1位を獲得 🎉🎉

©Commune Inc. | 6 解法紹介

©Commune Inc. | 7 全体パイプライン

©Commune Inc. | 8 1st Stage：ArcFaceによる人物判定 ArcFaceにて11クラス分類（label_id=0~10）を実施 • StratiﬁedGroupKFold

©Commune Inc. | 9 1st Stage：ArcFaceによる人物判定 top / sideでモデルを分割した理由 •

©Commune Inc. | 10 1st Stage：ArcFaceによる人物判定 BBoxのxy方向シフト & 拡大縮小を行い、テストデータの BBoxを疑似的に再現

©Commune Inc. | 11 2nd Stage：IoU回帰予測モデル与えられたBBox画像に対して、GroundTruthのBBoxとのIoUを予測する回帰モデルを作成 • top /

©Commune Inc. | 12 2nd Stage：IoU回帰予測モデル BBoxのxy方向シフト & 拡大縮小を行い、テストデータの BBoxを疑似的に再現

©Commune Inc. | 14 3rd Stage：最適化 [0.8570] ⇒ [0.9549] かなり精度が上がるかもしれない個数制約付き最大化による後処理

©Commune Inc. | 15 スコア推移最適化追加 3-stage制に変更 Swin Transformerに変更 epoch数増加

©Commune Inc. | 16 よかったところ（何故優勝できたか？）

©Commune Inc. | 17 よかったところ（何故優勝できたか？） 1. DiscussionのBaselineから仮説を立て、早期にコンペの特徴を把握できた 2. 問題や課題を整理・分解し、モデル構造や検証計画に上手く落とし込めた

©Commune Inc. | 18 1. DiscussionのBaselineから仮説を立て、早期にコンペの特徴を把握できた 1. CVはかなり高い ◦ 学習データに存在する選手の特定は結構簡単かも？

©Commune Inc. | 20 3. テストデータに対する予測において、 label=0, 8 の予測頻度は圧倒的に少ない ◦

©Commune Inc. | 21 3つの気付きをもとに、早々に高スコアを獲得することができた ※ Restart前 1. RedBullさんの[0.8448]baseline notebook同様にモデルを学習

©Commune Inc. | 23 2. 問題や課題を整理・分解し、モデル構造や検証計画に上手く落とし込めた一度冷静にコンペのタスクを整理・分解し、各タスクの予測精度と工数を整理してみたタスク予測精度学習・推論時間

©Commune Inc. | 24 タスク予測精度学習・推論時間備考 1. 　学習データに存在する選手を当てる

©Commune Inc. | 25 タスク予測精度学習・推論時間備考 1. 　学習データに存在する選手を当てる

©Commune Inc. | 26 タスク予測精度学習・推論時間備考 1. 　学習データに存在する選手を当てる

©Commune Inc. | 27 タスク予測精度学習・推論時間備考 1. 　学習データに存在する選手を当てる

©Commune Inc. | 28 全体パイプライン深夜や仕事中に学習だけ回す専用モデルを構築し改善や予測結果の目視確認を行 Stage1と2が完成した（諦めた）

©Commune Inc. | 29 まとめ

©Commune Inc. | 30 • 運が良かったです ◦ たまたま早期にコンペを理解でき、シンプルなアプローチでも上位に入れた • label_id

©Commune Inc. | 31 ご清聴ありがとうございました。運営の皆様、楽しいコンペをありがとうございました！