Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
バドミントンで試合展開から結果を予測してみる
Search
yhiss
February 16, 2020
0
1.8k
バドミントンで試合展開から結果を予測してみる
Sports Analyst Meetup #6でLTした内容です
yhiss
February 16, 2020
Tweet
Share
More Decks by yhiss
See All by yhiss
バドミントンでの試合の組み立て方を定量化したい
yhiss
1
71
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
158
15k
A Tale of Four Properties
chriscoyier
155
22k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
27
7.5k
Debugging Ruby Performance
tmm1
72
12k
Large-scale JavaScript Application Architecture
addyosmani
509
110k
Statistics for Hackers
jakevdp
796
220k
The Art of Programming - Codeland 2020
erikaheidi
49
13k
In The Pink: A Labor of Love
frogandcode
139
22k
BBQ
matthewcrist
83
9.2k
How to Ace a Technical Interview
jacobian
274
23k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
28
1.7k
We Have a Design System, Now What?
morganepeng
48
7.1k
Transcript
バドミントンで試合展開から結果 を予測してみる Sports Analyst Meetup #6 2020/02/16
自己紹介 yhiss(@yhiss_) 事業会社でデータ分析とか事業開発 スポーツ歴 バドミントン(9年ぐらい) 野球(6年ぐらい)
今回の分析について① 以前(Spoana #3) 試合の中で1点を取るために必要な要素、技 術について人力(自力)でデータを作って考察を実施 今回:点数の取り方から勝つor負けるといった結果への遷移を 考える
今回の分析について② 自分で試合をしている際に、点差等でなんとなく勝ちそう(負 けそう)な展開っぽく感じるが、実際に試合途中の点差で予測 できるのか? →手始めに、ゲーム開始から何回目のラリーまでの情報を使うと、 予測が可能になっていくのかを簡易的な予測モデルで検証
どんなスポーツ? 概要:1対1または2対2でシャトル(水鳥の羽)を打ち合う競技 ルール1:ラリーポイント制で、1点ずつ点数がカウントされる ルール2:21点の時点で点差2点以上or30点先取でセットを先取 ルール2補足:ラリー数最小:21(一方的)、最大59(競った場合)
今回の説明変数と目的変数 説明変数:各ラリーの時点での点数 (何回目のラリーまで採用するか閾値を変えて予測モデルを作る) 目的変数:最終的にどっちがセットを取ったのか アルゴリズム:Random Forest ラリー
1 2 3 片方の 点数 1 1 2 15 16 17 18 8 9 9 10 1 or 0 … … 説明変数
使用データ Badminton Game Data (BWF Super Series 2015-2017):Kaggle 2015年~2017年までの国際大会 シングルス・ダブルス、男子・女子、ミックス全部含む
データの分割 Training:2015,2016年のデータのうち8割 Validation: 2015,2016年のtraining以外の2割 Test: 2017年のデータ
結果(予測モデル毎の精度の比較) 指標:ROC-AUCでグラフを描画 ラリー数:20回まででAUC>0.8 ラリー数3等でもそれなり 点数だけで既にわりと当たる ラリー数:20のモデルを解釈して みる
結果(ラリー数20モデルの変数) 変数重要度でグラフ化 上にある程その変数は重要 (やはり)試合が進んだ時点の得 点が重要 一番重要度の高いラリー数20回目 の変数をピックアップ
結果(ラリー数20回目の変数) 予測への貢献度でグラフ化 プラスだと1セット取る方に効く 10点を基準にプラス・マイナス 方向に分布している 概ね想像できる結果となった 早めに頭打ちになるのは諸々のア ルゴリズムの影響かもしれない
まとめと今後分析したいこと まとめ 各ラリー毎の点数を説明変数として予測モデルを作ってみた 予想以上に精度が出ていた 変数毎の傾向はピックアップしたものでは概ねイメージ通り 今後分析したいこと 現状では、試合の展開(点数の推移)までは全然考慮できていない 時系列性等を加味して詳細にみると、もう少しみえてくるものが あるのではないか?