Slide 1

Slide 1 text

Sports Analyst Meetup #8 サーブの制球力を定量的に評価してみよう (テニスのはなし)

Slide 2

Slide 2 text

| 自己紹介 普段の仕事 データ分析とは無関係 → 分析は趣味 やっぱりデータサイエンスと関わりたいから転活する スポーツとの関わり アーチェリーをやってた(ライフル射撃も一瞬) テニスは見る専 動いてるものを捉える能力がゴミなので球技全般が無理

Slide 3

Slide 3 text

| クエスチョン Q. サーブのコントロールが良い or 悪いってどういうこと?

Slide 4

Slide 4 text

| クエスチョン Q. サーブのコントロールが良い or 悪いってどういうこと? A. コート内にちゃんと収められていて、かつ、 ライン際に集められているか否か

Slide 5

Slide 5 text

| 良いと感じるコントロールの実例 錦織(左)とフェデラー(右)の1stサーブ着弾点の比較 テニスは中継の合間にこういう画像がよく出てきます たしかに、錦織よりフェデラーのほうがコントロールが良さそう 画像出所:https://twitter.com/MattRacquet/status/1148989513290661893i

Slide 6

Slide 6 text

| 良いと感じるコントロールの実例 錦織(左)とフェデラー(右)の1stサーブ着弾点の比較 テニスは中継の合間にこういう画像がよく出てきます たしかに、錦織よりフェデラーのほうがコントロールが良さそう 「そんな気がする」以上の根拠は?

Slide 7

Slide 7 text

| ライン際は技術的にはすごくても… • ライン際に集めることはポイントを獲得するうえで重要? • 重要だとしてどのラインからの距離も等価(A, B, C, Dの価値は全部同じ)? A B C D 狙う意味があるところを狙って打ててこそ 価値があるコントロール能力 画像出所:TennisTV

Slide 8

Slide 8 text

| クエスチョン三度 Q. サーブのコントロールが良い or 悪いってどういうこと? A. コート内にちゃんと収められていて、かつ、 ライン際に集められているか否か よりサーバー側が有利になる場所にボールを集められているか

Slide 9

Slide 9 text

サーバー側が有利 ↓ サービスポイントが獲りやすい どこに着弾すれば「ポイントが獲れる」と予測され、 どこに着弾すれば「ポイントが獲れない」と予測されるのか

Slide 10

Slide 10 text

| データを集める ATP公式サイトに試合ごとの着弾点が載っているのでスクレイピング → 2019年で全525試合、11万3,588球分あった パッと見は画像だけど 座標がデータ(SVGタグ)に なってる Seleniumが難しかった……

Slide 11

Slide 11 text

| 狙う意味がある場所を探す 集めたデータを散布図にする • 左右は重要そう

Slide 12

Slide 12 text

| 狙う意味がある場所を探す 集めたデータを散布図にする • 左右は重要そう • 左右の有効ゾーンは斜めっぽい?

Slide 13

Slide 13 text

| 狙う意味がある場所を探す 集めたデータを散布図にする • 左右は重要そう • 左右の有効ゾーンは斜めっぽい? • 深さはあまり効いていない

Slide 14

Slide 14 text

| 狙う意味がある場所を探す 集めたデータを散布図にする • 左右は重要そう • 左右の有効ゾーンは斜めっぽい? • 深さはあまり効いていない • 「良い2nd=深い」というのが通説だが、

Slide 15

Slide 15 text

| 狙う意味がある場所を探す 集めたデータを散布図にする • 左右は重要そう • 左右の有効ゾーンは斜めっぽい? • 深さはあまり効いていない • 「良い2nd=深い」というのが通説だが、 どこが有効とは言いにくい

Slide 16

Slide 16 text

| 1stサーブで狙う意味がありそうな場所 重要度は高いけれど真っ直ぐではなさそう

Slide 17

Slide 17 text

| 1stサーブで狙う意味がありそうな場所 実は重要度が低そう 重要度は高いけれど真っ直ぐではなさそう

Slide 18

Slide 18 text

| 予測モデリング • 分類器はサポートベクターマシン • 1st、右対右、ハードコートに限定 • コートの材質によってバウンド時の減速・跳ね方が違う • 右打ち左打ちで回転方向と伸ばす腕が違う • 特徴量はX座標とY座標のみ コントロールの話だし、そもそも1球ごとの球速や回転のデータがない • 交差検証にはサーバーをグループとするGroupKFoldを採用 フェデラーのサーブで学習し、フェデラーの別のサーブを予測しても… 錦織のサーブで学習してジョコビッチのサーブ結果を当てられてこそのモデル 2次元上の2値の分類問題 → 境界決定線を可視化すれば狙うべき場所がわかる

Slide 19

Slide 19 text

| 予測結果 • ボディの有効ゾーンなし • センターよりワイドの方が厚い • センターは深い方が良い • ワイドは浅すぎると逆効果 • ボディの有効ゾーンなし • ワイドもセンターも同じくらいの幅 • ワイドは浅いほど、センターは深いほ ど有効 Adコート Deuceコート

Slide 20

Slide 20 text

| 予測結果

Slide 21

Slide 21 text

| 予測結果の解釈 遠いけど 腕を伸ばしやすい 近いけど 腕を伸ばしにくい 近くて 腕を伸ばしやすい 遠くて 腕を伸ばしにくい

Slide 22

Slide 22 text

| 予測結果の解釈 遠いけど 腕を伸ばしやすい 近いけど 腕を伸ばしにくい 近くて 腕を伸ばしやすい 遠くて 腕を伸ばしにくい リターナーから 遠ざかる方向に 回転がかからない リターナーから 遠ざかる方向に 回転がかかる

Slide 23

Slide 23 text

| 予測結果の解釈 遠いけど 腕を伸ばしやすい 近いけど 腕を伸ばしにくい 近くて 腕を伸ばしやすい 遠くて 腕を伸ばしにくい リターナーから 遠ざかる方向に 回転がかからない リターナーから 遠ざかる方向に 回転がかかる サーブとリターナー間の距離、腕の伸ばしやすさで 厚みが決まっていそう

Slide 24

Slide 24 text

| コントロール能力の基準 評価基準 サーブがどれだけ青いゾーンに入っているか

Slide 25

Slide 25 text

| 実質的な制球力ランキング ベスト10 ワースト10

Slide 26

Slide 26 text

| M. Raonicとは? ミロシュ・ラオニッチ 錦織のライバル的存在(別名・運命共同体) ラオニッチ 錦織 体格 大きい(196cm) 小さい(178cm) 得意なプレー サーブ ラリー 年齢 29歳 30歳 最高ランキング 3位 4位 主なグランドスラム実績 ウィンブルドン:準優勝(1) 全豪:ベスト4(1) 全米:準優勝(1) ベスト4(2) 2014年 ウィンブルドン4回戦で錦織を倒して ベスト4 全米4回戦でラオニッチを倒して 準優勝 2016年 全豪ベスト4を含む活躍で3位争い 全米ベスト4を含む活躍で3位争い 2017年 故障してシーズン途中で離脱 故障してシーズン途中で離脱 2020年 コロナの影響でランキング凍結 30位(1350ポイント) コロナの影響でランキング凍結 31位(1345ポイント) ラオニッチのデータを学 習して錦織の活躍を予測 できる……? 画像出所:https://ausopen.com/

Slide 27

Slide 27 text

| まとめ • サーブはライン際に集めることが最善、とは限らない • ポイントを獲りやすい場所に精度良く集める能力こそが 実質的な制球力では • 1stサーブは深さよりも左右にコントロールすることが大事 • サイドライン・センターラインからの距離(左右の幅)は、 深さによって許容される範囲が異なる • 2ndサーブは狙うべき明確な場所がない • ラオニッチは世界一サーブのコントロールが良い 以上