Upgrade to Pro — share decks privately, control downloads, hide ads and more …

NFLコンペ2026 解法

NFLコンペ2026 解法

『【LINEヤフー データサイエンス Meetup】Kaggle Grandmasterが教える開発と解法&コンペ主催企業が語る舞台裏 他』の登壇資料です。

More Decks by LINEヤフーTech (LY Corporation Tech)

Other Decks in Technology

Transcript

  1. © LY Corporation 自己紹介 • 田中 良佑 • Yahoo!検索の広告部門に所属 •

    ショッピング広告の学習モデルを担当 • kaggle GM (修士1年に獲得)
  2. © LY Corporation データセットと評価指標 input.csv • 選手のtracking data • xy座標

    速度 加速度 方向 • 選手の情報 • 予測対象かどうか 身長・体重 役割 • その他 • 右攻め・左攻め 予測フレーム数 パス後のボールが落ちる位置 output.csv (ラベルデータ) • 選手のxy座標 • 今回のコンペの予測対象
  3. © LY Corporation コンペのポイント 1. 可変長の未来予測 • パス後のフレーム分だけ予測する必要がある • 短いものだと1~10フレーム分、長いものだと30~40フレーム予測

    2. 選手の時系列情報と選手間の相互作用をモデルにどう与えるか 3. 時系列系のNNが強いコンペ • Transformer, RNN, 1dCNN などを上手くモデリングする技術が重要 • 時系列コンペは多い印象。同時開催されたMABeコンペ もこのタイプ
  4. © LY Corporation 全体図 • Temporal Encoder で各選手の時系 列変化を捉える •

    Player Encoder で同一時刻の選手 間相互作用を捉える • 将来フレームの相対位置を予測する 時系列情報と選手間相互作用を分け て扱う構造 Input (num_player, seq_len, features) Temporal Encoder Player Encoder Output (num_player, output_len, 2)
  5. © LY Corporation モデル構造 • Temporal Encoder • 時系列方向にTransformer Encoder

    • 自分のモデル構造ではTransformerが1DCNN, LSTMよりも良かった • Player Encoder • 選手方向にTransformer Encoder • 30フレームを入力し、40フレームを予測 • 絶対座標予測ではなく、フレーム間の差分を予測 • absolute = cumsum(delta) + last position • loss: MSE • 予測対象ではないフレームや選手はmaskする • 特徴量: x y座標、速度、加速度 など合計24個 • 5 fold
  6. © LY Corporation 工夫点 (モデル構造) • Player Encoder のAttention score

    のbias を選手間のユークリッド距離ベー スにすることで、自身に近い相手ほど相互作用しやすいという事前知識をモ デルに与える 𝐴𝑡𝑡𝑒𝑛𝑡𝑖𝑜𝑛 𝑄, 𝐾, 𝑉 = 𝑠𝑜𝑓𝑡𝑚𝑎𝑥 QKT dk + B 𝑉 時刻tにおいて、選手iが選手jを参照するスコアは b ij (t) = clamp −α log(1 + d ij (t)), −c, 0 距離 0 に近い相手 → bias は 0 に近い 距離が離れる相手 → より負の値になる ので、遠い相手ほど attention logit を下げる働きをする
  7. © LY Corporation 工夫点 (前処理、データ増強) 1. 攻撃方向を右向きに統一(x flip) • input.csv

    のplay_direction列を活用 2. y軸反転augmentation & TTA 3. 時間シフトによるaugmentation • 入力系列の最後の数フレームを切り取り、予測ラベルの先頭に結合する ことで、擬似ラベルを生成 • 長期フレームのデータは少なめ & 予測が難しい 問題に対処 入力系列 出力系列 入力系列 出力系列
  8. © LY Corporation CV LB モデル CV Public LB baseline

    (x,y 軸flip aug) 0.556 0.537 距離バイアスAttention + モデルの細 かな改善 0.524 0.507 時間シフトaugmentation 0.505 0.495 ensemble (cvの切り方を変えたモデ ルがあるため、CVはx) ??? 0.478 • シングルモデルでPublic LB 0.495 • その後はネタ切れで、モデルのバリエーションを無理矢理増やしてアンサン ブルして金圏に到達 • Temporal → Player を交互にN回繰り返すモデル • 最終日に10fold のモデルのfold 0, 1 を追加
  9. © LY Corporation 上位解法 1. 特徴量少なめ & NN のモデリングで工夫 •

    時系列方向: 1dCNN, GRU, Transformer • 選手方向: Transformer • モデル構造, augmentation, loss の工夫が上位陣の差分 2. 時間シフトAugmentation • 1st , 8th(私) • 1st はパスの時刻をモデルに追加 3. 過去のNFLコンペデータを学習データに追加 • 5th • 自分も試したが効かなかった データの前処理などに差分があるかも?
  10. © LY Corporation 生成AI 活用 • Codex のみ使用 • モデルはGPT-5.1-Codex-Max

    • 精度改善案の質において、Claude Code (Opus) や Gemini よりも良かっ た • 解法の工夫点の「距離バイアスAttention」を提案 & 実装してくれた • 過去コンペ (NFL 2021) の解法をCodexに突っ込んで案出し • x,y 軸flip を提案してくれた • コードの実装だけでなく、手法の案出しまで任せられるようになった • 生成AIの優劣についてはコンペ参加時の2025年11~12月における感想です
  11. © LY Corporation まとめ • NFLコンペでソロ金 • 時系列情報と選手間の相互作用をNNで上手くモデリングすることが鍵 • データやタスクの理解度が問われるコンペ

    で楽しいコンペでした • モデルの学習時間少なめで精度改善サイクルを高速で回すことができるため、 時間がない社会人にも優しいコンペ