バドミントンで試合展開から結果を予測してみる
by
yhiss
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
バドミントンで試合展開から結果 を予測してみる Sports Analyst Meetup #6 2020/02/16
Slide 2
Slide 2 text
自己紹介 yhiss(@yhiss_) 事業会社でデータ分析とか事業開発 スポーツ歴 バドミントン(9年ぐらい) 野球(6年ぐらい)
Slide 3
Slide 3 text
今回の分析について① 以前(Spoana #3) 試合の中で1点を取るために必要な要素、技 術について人力(自力)でデータを作って考察を実施 今回:点数の取り方から勝つor負けるといった結果への遷移を 考える
Slide 4
Slide 4 text
今回の分析について② 自分で試合をしている際に、点差等でなんとなく勝ちそう(負 けそう)な展開っぽく感じるが、実際に試合途中の点差で予測 できるのか? →手始めに、ゲーム開始から何回目のラリーまでの情報を使うと、 予測が可能になっていくのかを簡易的な予測モデルで検証
Slide 5
Slide 5 text
どんなスポーツ? 概要:1対1または2対2でシャトル(水鳥の羽)を打ち合う競技 ルール1:ラリーポイント制で、1点ずつ点数がカウントされる ルール2:21点の時点で点差2点以上or30点先取でセットを先取 ルール2補足:ラリー数最小:21(一方的)、最大59(競った場合)
Slide 6
Slide 6 text
今回の説明変数と目的変数 説明変数:各ラリーの時点での点数 (何回目のラリーまで採用するか閾値を変えて予測モデルを作る) 目的変数:最終的にどっちがセットを取ったのか アルゴリズム:Random Forest ラリー 1 2 3 片方の 点数 1 1 2 15 16 17 18 8 9 9 10 1 or 0 … … 説明変数
Slide 7
Slide 7 text
使用データ Badminton Game Data (BWF Super Series 2015-2017):Kaggle 2015年~2017年までの国際大会 シングルス・ダブルス、男子・女子、ミックス全部含む データの分割 Training:2015,2016年のデータのうち8割 Validation: 2015,2016年のtraining以外の2割 Test: 2017年のデータ
Slide 8
Slide 8 text
結果(予測モデル毎の精度の比較) 指標:ROC-AUCでグラフを描画 ラリー数:20回まででAUC>0.8 ラリー数3等でもそれなり 点数だけで既にわりと当たる ラリー数:20のモデルを解釈して みる
Slide 9
Slide 9 text
結果(ラリー数20モデルの変数) 変数重要度でグラフ化 上にある程その変数は重要 (やはり)試合が進んだ時点の得 点が重要 一番重要度の高いラリー数20回目 の変数をピックアップ
Slide 10
Slide 10 text
結果(ラリー数20回目の変数) 予測への貢献度でグラフ化 プラスだと1セット取る方に効く 10点を基準にプラス・マイナス 方向に分布している 概ね想像できる結果となった 早めに頭打ちになるのは諸々のア ルゴリズムの影響かもしれない
Slide 11
Slide 11 text
まとめと今後分析したいこと まとめ 各ラリー毎の点数を説明変数として予測モデルを作ってみた 予想以上に精度が出ていた 変数毎の傾向はピックアップしたものでは概ねイメージ通り 今後分析したいこと 現状では、試合の展開(点数の推移)までは全然考慮できていない 時系列性等を加味して詳細にみると、もう少しみえてくるものが あるのではないか?