Sports Analyst Meetup #5 LT - 目指せPGAツアー賞金王

by OpenJNY

Slide 1

Slide 1 text

目指せ PGA ツアー賞金王

Slide 2

Slide 2 text

$ about-me . ├── 山口順也 (Junya Yamaguchi) │ ├── @OpenJNY │ ├── 某パブリッククラウドで Support Eng. やってます (新卒 1 年目) │ └── Networking の勉強中 (LB, WAF, etc) └── 東京工業大学・大学院で人工知能基礎と機械学習を勉強してました ├── 理論よりの本 (e.g. PRML, MLaPP) が好き ├── 卒論は「SAT ソルバ × GPGPU」 ├── 修論は「SAT ソルバ × グラフ埋め込み」 └── Kaggle はやってませんグラフ埋め込みは、めちゃくちゃおもしろい&今ホットなトピックなので、興味あるかたいれば是非説明したい内容

Slide 3

Slide 3 text

No content

Slide 4

Slide 4 text

No content

Slide 5

Slide 5 text

LT テーマ: PGA ツアーの stats を GLM/GAM で分析してみる - https://www.kaggle.com/bradklassen/pga-tour-20102018-data - LT の目的: - Python の GAM ライブラリ pyGAM を知る - PGA ツアーで賞金王になるための知見をゴル活に活かす - ノートブックは以下の URL で公開しています - https://www.kaggle.com/juyamagu/pga-tour-analysis-by-gam

Slide 6

Slide 6 text

背景: モデルの入力次元と解釈性 - 3 以上の次元を持つ入力を扱う関数は、人間が視覚的に解釈できない - なので解釈可能にするには、入力を 1 次元ないしは 2 次元に抑える必要がある - 複数の入力を一気に扱う機械学習モデル (e.g. DNN) などは解釈できない… N/A 2 次元以下の入力の関数を組み合わせたモデルなら視覚的に解釈可能

Slide 7

Slide 7 text

GLM と GAM • 一般化線形モデル (Generalized Linear Model; GLM) • 一般化加法モデル (Generalized Linear Model; GLM) GLM の詳細は緑本や MLaPP 9章、GAM の詳細はカステラ本 9章を参照くださいm(_ _)m Hastie, T. J.; Tibshirani, R. J. (1990) Nelder, J.; Wedderburn, R. (1972)

Slide 8

Slide 8 text

pyGAM https://pygam.readthedocs.io/en/latest/

Slide 9

Slide 9 text

$ pip install pygam

Slide 10

Slide 10 text

No content

Slide 11

Slide 11 text

データ概観: スキーマカラム名説明 PlayerName 名前 Season 年度 Money 年間獲得賞金 ($) DrivingDistance 平均ドライバー飛距離 (yard) DrivingAccuracy フェアウェイキープ率 DistanceEfficiency 飛距離/スピードの平均 NonDrivingDistance 平地での平均飛距離 (yard) カラム名説明 BallSpeed ボールの平均スピード ScramblingSand バンカーからのスクランブル率 ScramblingFringe フリンジからのスクランブル率 ScramblingRough ラフからのスクランブル率 ThreePutRate スリーパットを叩いたホール率 BirdieConversion バーディ以上のホール率

Slide 12

Slide 12 text

データ概観: 相関係数賞金と正の相関が強いもの - ドライバーの距離 - 飛距離の効率性 (スピン量) - ボールスピード - ラフからのリカバリの上手さ - バーディよりよい成績でホールを終える率賞金と負の相関が認められるもの - ドライバー以外のショット飛距離 - 3 パットするホールの割合

Slide 13

Slide 13 text

PyGAM: GLM による Money 予測

Slide 14

Slide 14 text

No content

Slide 15

Slide 15 text

PyGAM: GAM による Money の予測 l (Linear) を s (Spline) に置換するだけ

Slide 16

Slide 16 text

No content

Slide 17

Slide 17 text

GAM の表現力の豊かさ GLM GAM 一般化加法モデル一般化線形モデル ✓ BirdieConversion (バーディより良い成績のホール率) が大きいほど、賞金が稼げる傾向にある ✓ BirdieConversion (バーディより良い成績のホール率) が大きいほど、賞金が稼げる傾向にある ✓ ただし33 パーセント付近に「大きな壁」の存在 ✓ < 33% だと、賞金の伸びは限定的 ✓ 壁を超えると一気に賞金獲得の期待が高まる

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text