Upgrade to Pro — share decks privately, control downloads, hide ads and more …

競輪選手の体力を視覚化するための物体認識とデータサイエンスの融合

CyberAgent
July 09, 2024
3k

 競輪選手の体力を視覚化するための物体認識とデータサイエンスの融合

CyberAgent

July 09, 2024
Tweet

More Decks by CyberAgent

Transcript

  1. 松田 和己(まつだ かずき) • 社歴:2015年4月新卒入社 • 所属:メディア統括本部 > Data Science

    Center(DSC) • 職種:データサイエンティスト • 担当サービス:WINTICKET • 業務内容: ◦ ユーザ体験向上のためのデータ分析や機能開発 ◦ スポーツ映像テックのためのデータサイエンス ◦ データチーム(WINTICKET担当)のマネジメント ◦ 横軸組織として事業との組織連携 自己紹介
  2. • 3つの競輪場に対応 ◦ 小倉 競輪場(福岡県) ◦ 平塚 競輪場(神奈川県) ◦ 前橋

    競輪場(群馬県) • これまで通り通常の映像を選択できる オンオフ機能を搭載 • ABEMA競輪チャンネル番組でも活用 WINLIVE
  3. 2D3Dどちらも、動画像内の選手位置を推定する、というタスク 2D • IN:放送用のレース映像 • OUT:動画内の位置情報 3D • IN:専用の固定カメラのレース映像 x

    複数 (※実施時に設置・撮影) • OUT:競輪場内の3D位置情報 物体認識技術 - タスク エフェクト表示位置 レースの進捗状況 エフェクト判定 選手の体力状況 選手の3D座標
  4. 物体認識技術 - 2D 改善事例 課題 • 放送用レース映像は1カメラなので、審判台 などの障害物や選手同士の重なり時に抜け (認識漏れ)が発生しやすい 方法・結果

    • 該当フレームで認識されない選手がいた場 合、直前フレームまでの情報を用いてカルマ ンフィルタによる補完を行うことで精度改善 • 車番の誤認識についても低減 後:6番車(緑)を正しく認識し、5番車(黄)も正常に認識 前:審判台で6番車(緑)を見失い、5番車(黄)と誤認識
  5. 物体認識技術 - 3D 概要 • 2Dと同様に、動画像内の位置を推定 • 3D専用の固定カメラを複数台設置する必要有 ◦ これが対象場が限られている理由

    • 競輪場のスキャンデータを作成することで、 カメラの位置と向きを事前推定でき、動画像 内の位置を競輪場における3D座標に変換する ことも可能となる • 画角の見切れに対応するため、複数台の結果 をマージして3D座標の推測結果を得る
  6. 物体認識技術 - 3D 改善事例 課題 • 数万枚のアノテーションデータが必要となっ ていて、コスト(お金と時間)がかかる 方法・結果 •

    類似したアノテーションデータを間引く、つ まりアノテーションをする画像枚数を減らし ても精度が維持されるかどうか検証した • 結果、多様性が重要であり、1/5 に間引いた 場合でも問題ないことがわかった 評価項 目 説明 all 1/5 1/15 + aug3 1/15 Acc@1 予測した上位1つのラ ベルが正解ラベルと一 致する割合 96.453 96.673 95.729 95.041 Acc@5 予測した上位5つのラ ベルの中に正解ラベル が含まれる割合 99.938 99.972 99.910 99.924
  7. 体力を数値化するためのデータサイエンス (0,40) (0,-40) (x,y) (0,0) (40,0) (-40,0) (-40,40 ) (-40,-40)

    (40,40) (40,-40) 実際の競輪場のコースは非常に複雑な形をしていて、厳密な位置関係を求めることが難しい。 これに対して、シンプルな半円形状を仮定する、ことで計算が簡略化できると考えた。 ※画像は、静岡競輪場公式サイト( https://www.shizuoka38.jp/ )より引用 シンプル化
  8. 体力を数値化するためのデータサイエンス 0.5m 1.0m 2.0m 3.0m 1.5m 1.0m 0.5m 1.0m 0.5m

    ① 他選手との位置関係を求め、非線形な関数を定義しスリップストリーム効果を計算する
  9. 体力を数値化するためのデータサイエンス 0.5m 1.0m 2.0m 3.0m 1.5m 1.0m 0.5m 1.0m 0.5m

    ① 他選手との位置関係を求め、非線形な関数を定義しスリップストリーム効果を計算する ② 最も強い効果を、その選手が受ける効果とする
  10. 体力を数値化するためのデータサイエンス (0,40) (0,-40) (x,y) (0,0) (40,0) (-40,0) (-40,40 ) (-40,-40)

    (40,40) (40,-40) θ レースの進捗状況 • 位置関係から先頭選手が判定でき、先頭選手 の座標がつくる角度をベースに計算している エフェクト表示判定 • 計算された空気抵抗の値や、残り体力を比較 して判定している
  11. 体力を数値化するためのデータサイエンス 定量評価(テスト走行計測) • 場所:平塚競輪場 • 観点:構築した計算ロジックは、どの程度正しいのか実態と比べる方法がなかった • 方法:パワーメーター(漕ぐ力を計測する装置) を装着した自転車で実際に競輪場を走行 ◦

    特に前方に選手がいるケースで、走行速度が近しい実際のレースでの計算結果と差がないか ◦ 低速設定(35km/h)と高速設定(50km/h)の2つの状況 • 結果:以下のような結果で、実態と大きな差のないロジックとなっていることが確認できた ◦ 力の大きさの絶対値は、±20W程度 の差 ◦ 追走する選手の軽減率は、±2%程度 の差
  12. 体力を数値化するためのデータサイエンス 定性評価(一部事前) • 対象:有識者(サービスメンバーや競輪選手) • 観点:WINLIVEの映像(特に体力)について違和感ないか • 方法: ◦ サービスメンバーや競輪選手:ドメイン知識を持つ人から見ても違和感がないか

    ◦ 競輪選手のみ:(どちらかというと事前調査的な意味合いが強い) ▪ 風(空気抵抗)をどう考えているか ▪ スリップストリームの効果をどう感じているか • 結果: ◦ リリースOKとなった
  13. WINLIVE の効果検証 定量評価(プレリリース時A/Bテスト) • 期間:2023年1月小倉競輪 • 対象:約76,000ユーザ(新規ユーザ) • 観点:WINLIVEによって競輪新規ユーザの理解が促進され利用意向度が向上するか •

    方法:行動ログを用いてレース映像視聴ユーザの翌日視聴率や翌日投票率を比較 • 結果: ◦ 翌日視聴率が+3.2pt、翌日投票率が+2.9pt ◦ 参考:レース映像視聴ユーザは、両群合計で4,000弱(対象全体の5%)
  14. WINLIVE の効果検証 定性評価(プレリリース時A/Bテスト) • 期間:2023年1月小倉競輪 • 対象:約76,000ユーザ(新規ユーザ) • 観点:WINLIVEについてどのように感じているか •

    方法:アンケート ◦ 5段階評価(理解のしやすさ、面白さ、興味関心向上)、自由記述 • 結果: ◦ 未経験層で平均4程度の高い支持 を得られた ◦ 玄人層からは通常映像を求める声も ▪ オンオフ機能の初期リリース時に組み込む意思決定
  15. WINLIVE の効果検証 定量評価(リリース後) • 期間:2023年5月小倉競輪、前橋競輪 • 対象:全ユーザ(レース映像視聴ユーザ) • 観点:WINLIVEが実際にリリースされオンオフ機能が活用されているか •

    方法:行動ログを用いて新規/既存ユーザの機能オンオフ率を比較 • 結果: ◦ 既存ユーザを含めて多くのユーザがWINLIVEを利用している(今後もFBを注視していく) ▪ 新規ユーザ:85%程度のユーザがオン ▪ 既存ユーザ:75%程度のユーザがオン