Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
バドミントンで試合展開から結果を予測してみる
Search
yhiss
February 16, 2020
0
1.7k
バドミントンで試合展開から結果を予測してみる
Sports Analyst Meetup #6でLTした内容です
yhiss
February 16, 2020
Tweet
Share
More Decks by yhiss
See All by yhiss
バドミントンでの試合の組み立て方を定量化したい
yhiss
1
68
Featured
See All Featured
Building Effective Engineering Teams - LeadDev
addyosmani
28
1.8k
Reflections from 52 weeks, 52 projects
jeffersonlam
344
19k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
24
2.3k
Facilitating Awesome Meetings
lara
41
5.6k
Art, The Web, and Tiny UX
lynnandtonic
288
19k
The MySQL Ecosystem @ GitHub 2015
samlambert
242
12k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
13
1.5k
GitHub's CSS Performance
jonrohan
1024
450k
Web Components: a chance to create the future
zenorocha
305
41k
Optimising Largest Contentful Paint
csswizardry
7
2.3k
In The Pink: A Labor of Love
frogandcode
138
21k
Docker and Python
trallard
33
2.7k
Transcript
バドミントンで試合展開から結果 を予測してみる Sports Analyst Meetup #6 2020/02/16
自己紹介 yhiss(@yhiss_) 事業会社でデータ分析とか事業開発 スポーツ歴 バドミントン(9年ぐらい) 野球(6年ぐらい)
今回の分析について① 以前(Spoana #3) 試合の中で1点を取るために必要な要素、技 術について人力(自力)でデータを作って考察を実施 今回:点数の取り方から勝つor負けるといった結果への遷移を 考える
今回の分析について② 自分で試合をしている際に、点差等でなんとなく勝ちそう(負 けそう)な展開っぽく感じるが、実際に試合途中の点差で予測 できるのか? →手始めに、ゲーム開始から何回目のラリーまでの情報を使うと、 予測が可能になっていくのかを簡易的な予測モデルで検証
どんなスポーツ? 概要:1対1または2対2でシャトル(水鳥の羽)を打ち合う競技 ルール1:ラリーポイント制で、1点ずつ点数がカウントされる ルール2:21点の時点で点差2点以上or30点先取でセットを先取 ルール2補足:ラリー数最小:21(一方的)、最大59(競った場合)
今回の説明変数と目的変数 説明変数:各ラリーの時点での点数 (何回目のラリーまで採用するか閾値を変えて予測モデルを作る) 目的変数:最終的にどっちがセットを取ったのか アルゴリズム:Random Forest ラリー
1 2 3 片方の 点数 1 1 2 15 16 17 18 8 9 9 10 1 or 0 … … 説明変数
使用データ Badminton Game Data (BWF Super Series 2015-2017):Kaggle 2015年~2017年までの国際大会 シングルス・ダブルス、男子・女子、ミックス全部含む
データの分割 Training:2015,2016年のデータのうち8割 Validation: 2015,2016年のtraining以外の2割 Test: 2017年のデータ
結果(予測モデル毎の精度の比較) 指標:ROC-AUCでグラフを描画 ラリー数:20回まででAUC>0.8 ラリー数3等でもそれなり 点数だけで既にわりと当たる ラリー数:20のモデルを解釈して みる
結果(ラリー数20モデルの変数) 変数重要度でグラフ化 上にある程その変数は重要 (やはり)試合が進んだ時点の得 点が重要 一番重要度の高いラリー数20回目 の変数をピックアップ
結果(ラリー数20回目の変数) 予測への貢献度でグラフ化 プラスだと1セット取る方に効く 10点を基準にプラス・マイナス 方向に分布している 概ね想像できる結果となった 早めに頭打ちになるのは諸々のア ルゴリズムの影響かもしれない
まとめと今後分析したいこと まとめ 各ラリー毎の点数を説明変数として予測モデルを作ってみた 予想以上に精度が出ていた 変数毎の傾向はピックアップしたものでは概ねイメージ通り 今後分析したいこと 現状では、試合の展開(点数の推移)までは全然考慮できていない 時系列性等を加味して詳細にみると、もう少しみえてくるものが あるのではないか?