Slide 1

Slide 1 text

バドミントンで試合展開から結果 を予測してみる Sports Analyst Meetup #6 2020/02/16

Slide 2

Slide 2 text

自己紹介 yhiss(@yhiss_) 事業会社でデータ分析とか事業開発 スポーツ歴 バドミントン(9年ぐらい) 野球(6年ぐらい)

Slide 3

Slide 3 text

今回の分析について① 以前(Spoana #3) 試合の中で1点を取るために必要な要素、技 術について人力(自力)でデータを作って考察を実施 今回:点数の取り方から勝つor負けるといった結果への遷移を 考える

Slide 4

Slide 4 text

今回の分析について② 自分で試合をしている際に、点差等でなんとなく勝ちそう(負 けそう)な展開っぽく感じるが、実際に試合途中の点差で予測 できるのか? →手始めに、ゲーム開始から何回目のラリーまでの情報を使うと、 予測が可能になっていくのかを簡易的な予測モデルで検証

Slide 5

Slide 5 text

どんなスポーツ? 概要:1対1または2対2でシャトル(水鳥の羽)を打ち合う競技 ルール1:ラリーポイント制で、1点ずつ点数がカウントされる ルール2:21点の時点で点差2点以上or30点先取でセットを先取 ルール2補足:ラリー数最小:21(一方的)、最大59(競った場合)

Slide 6

Slide 6 text

今回の説明変数と目的変数  説明変数:各ラリーの時点での点数 (何回目のラリーまで採用するか閾値を変えて予測モデルを作る)  目的変数:最終的にどっちがセットを取ったのか  アルゴリズム:Random Forest ラリー 1 2 3 片方の 点数 1 1 2 15 16 17 18 8 9 9 10 1 or 0 … … 説明変数

Slide 7

Slide 7 text

使用データ Badminton Game Data (BWF Super Series 2015-2017):Kaggle 2015年~2017年までの国際大会 シングルス・ダブルス、男子・女子、ミックス全部含む データの分割 Training:2015,2016年のデータのうち8割 Validation: 2015,2016年のtraining以外の2割 Test: 2017年のデータ

Slide 8

Slide 8 text

結果(予測モデル毎の精度の比較) 指標:ROC-AUCでグラフを描画 ラリー数:20回まででAUC>0.8 ラリー数3等でもそれなり 点数だけで既にわりと当たる ラリー数:20のモデルを解釈して みる

Slide 9

Slide 9 text

結果(ラリー数20モデルの変数) 変数重要度でグラフ化 上にある程その変数は重要 (やはり)試合が進んだ時点の得 点が重要 一番重要度の高いラリー数20回目 の変数をピックアップ

Slide 10

Slide 10 text

結果(ラリー数20回目の変数) 予測への貢献度でグラフ化 プラスだと1セット取る方に効く 10点を基準にプラス・マイナス 方向に分布している 概ね想像できる結果となった 早めに頭打ちになるのは諸々のア ルゴリズムの影響かもしれない

Slide 11

Slide 11 text

まとめと今後分析したいこと まとめ 各ラリー毎の点数を説明変数として予測モデルを作ってみた 予想以上に精度が出ていた 変数毎の傾向はピックアップしたものでは概ねイメージ通り 今後分析したいこと 現状では、試合の展開(点数の推移)までは全然考慮できていない 時系列性等を加味して詳細にみると、もう少しみえてくるものが あるのではないか?