Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
バドミントンで試合展開から結果を予測してみる
Search
yhiss
February 16, 2020
0
2k
バドミントンで試合展開から結果を予測してみる
Sports Analyst Meetup #6でLTした内容です
yhiss
February 16, 2020
Tweet
Share
More Decks by yhiss
See All by yhiss
バドミントンでの試合の組み立て方を定量化したい
yhiss
1
75
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Gamification - CAS2011
davidbonilla
81
5.4k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
GitHub's CSS Performance
jonrohan
1031
460k
Rails Girls Zürich Keynote
gr2m
95
14k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.7k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Music & Morning Musume
bryan
46
6.6k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
510
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Transcript
バドミントンで試合展開から結果 を予測してみる Sports Analyst Meetup #6 2020/02/16
自己紹介 yhiss(@yhiss_) 事業会社でデータ分析とか事業開発 スポーツ歴 バドミントン(9年ぐらい) 野球(6年ぐらい)
今回の分析について① 以前(Spoana #3) 試合の中で1点を取るために必要な要素、技 術について人力(自力)でデータを作って考察を実施 今回:点数の取り方から勝つor負けるといった結果への遷移を 考える
今回の分析について② 自分で試合をしている際に、点差等でなんとなく勝ちそう(負 けそう)な展開っぽく感じるが、実際に試合途中の点差で予測 できるのか? →手始めに、ゲーム開始から何回目のラリーまでの情報を使うと、 予測が可能になっていくのかを簡易的な予測モデルで検証
どんなスポーツ? 概要:1対1または2対2でシャトル(水鳥の羽)を打ち合う競技 ルール1:ラリーポイント制で、1点ずつ点数がカウントされる ルール2:21点の時点で点差2点以上or30点先取でセットを先取 ルール2補足:ラリー数最小:21(一方的)、最大59(競った場合)
今回の説明変数と目的変数 説明変数:各ラリーの時点での点数 (何回目のラリーまで採用するか閾値を変えて予測モデルを作る) 目的変数:最終的にどっちがセットを取ったのか アルゴリズム:Random Forest ラリー
1 2 3 片方の 点数 1 1 2 15 16 17 18 8 9 9 10 1 or 0 … … 説明変数
使用データ Badminton Game Data (BWF Super Series 2015-2017):Kaggle 2015年~2017年までの国際大会 シングルス・ダブルス、男子・女子、ミックス全部含む
データの分割 Training:2015,2016年のデータのうち8割 Validation: 2015,2016年のtraining以外の2割 Test: 2017年のデータ
結果(予測モデル毎の精度の比較) 指標:ROC-AUCでグラフを描画 ラリー数:20回まででAUC>0.8 ラリー数3等でもそれなり 点数だけで既にわりと当たる ラリー数:20のモデルを解釈して みる
結果(ラリー数20モデルの変数) 変数重要度でグラフ化 上にある程その変数は重要 (やはり)試合が進んだ時点の得 点が重要 一番重要度の高いラリー数20回目 の変数をピックアップ
結果(ラリー数20回目の変数) 予測への貢献度でグラフ化 プラスだと1セット取る方に効く 10点を基準にプラス・マイナス 方向に分布している 概ね想像できる結果となった 早めに頭打ちになるのは諸々のア ルゴリズムの影響かもしれない
まとめと今後分析したいこと まとめ 各ラリー毎の点数を説明変数として予測モデルを作ってみた 予想以上に精度が出ていた 変数毎の傾向はピックアップしたものでは概ねイメージ通り 今後分析したいこと 現状では、試合の展開(点数の推移)までは全然考慮できていない 時系列性等を加味して詳細にみると、もう少しみえてくるものが あるのではないか?