Slide 1

Slide 1 text

リオオリンピック 球技の結果予測: 統一予測モデルの構築 小中英嗣(名城大学) E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)

Slide 2

Slide 2 text

自己紹介 小中英嗣(こなか・えいじ) 名城大学理工学部 准教授 専門分野 スポーツ統計(とこれから名乗りたい) システム制御(最適化,統計的・確率的設計など) Twitter(@konakalab)で研究についてつぶやいています Bリーグ・Jリーグの予測 大相撲力士の定量的評価,など E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)

Slide 3

Slide 3 text

リオオリンピックで 試した予測 リオ五輪5競技10種目での全試合(370試合)の勝敗とメダ ル獲得国(30)を予測 試合結果:各競技の公式世界ランキングと比較 メダル獲得:専門家と比較. 著名雑誌(Sports Illustrated) 新聞(USA Today) 統計予測の会社(Gracenote) 予測結果→モデルの構成とその意図,の順でお話します. 6月出版予定の学術論文の内容(宣伝?です) E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)

Slide 4

Slide 4 text

予測結果 公式ランキングとの比較 E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) 世界ランキング 正解 不正解 提案手法 正解 215 不正解 85 370 見解が分かれた70試合の予測結果は・・・??

Slide 5

Slide 5 text

予測結果 公式ランキングとの比較 E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) 世界ランキング 正解 不正解 提案手法 正解 215 47 262 不正解 23 85 108 238 132 370 提案手法の予測精度が優れている (かつ統計的有意性あり. < 0.01)

Slide 6

Slide 6 text

予測結果 専門家とのメダル予測比較 順位も当てる メダル獲得を当てる E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) メダル数 順位も当てる メダル獲得を 当てる 提案手法 30 世界ランキング 30 Sports Illustrated 30 USA Today 30 Gracenote 30

Slide 7

Slide 7 text

予測結果 専門家とのメダル予測比較 順位も当てる メダル獲得を当てる E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) メダル数 順位も当てる メダル獲得を 当てる 提案手法 30 10 19 世界ランキング 30 Sports Illustrated 30 USA Today 30 Gracenote 30

Slide 8

Slide 8 text

予測結果 専門家とのメダル予測比較 順位も当てる メダル獲得を当てる E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) メダル数 順位も当てる メダル獲得を 当てる 提案手法 30 10 19 世界ランキング 30 6 14 Sports Illustrated 30 8 16 USA Today 30 7 14 Gracenote 30 10 14

Slide 9

Slide 9 text

予測結果 専門家とのメダル予測比較 E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) メダル数 順位も当てる メダル獲得を 当てる 提案手法 30 10 19 世界ランキング 30 6 14 Sports Illustrated 30 8 16 USA Today 30 7 14 Gracenote 30 10 14 提案手法の予測精度が優れている (統計的有意性は不明.サンプル数少.)

Slide 10

Slide 10 text

結果の解釈 世界ランキングは各チームの「勝つための能力」を適切に 定量化できていない ランキングが高い→勝つ可能性が高い,の関連付けが十分では無 い. 専門家の予測は苦手な分野がある 大量の過去の試合結果を全て適切に反映させるような実力評価(提 案手法の要点) E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)

Slide 11

Slide 11 text

予測モデルの構築: 予測対象競技の選定 以下を満たす5競技10種目を対象とした. チームスポーツ 得点の多少を競う 球技 バスケットボール,ハンドボール,ホッケー,バレーボール, 水球の5種目それぞれ男女 これらの競技共通の本質は?? E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)

Slide 12

Slide 12 text

球技の本質 E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) 「自分が1点取られる間に何点取れるか?」=「得失点 比」が本質 得失点(または無得点)の最小単位を繰り返す確率過程 得失点比は対戦チーム間の実力差で定まる(という仮定) 対比較法 (得失点比)=1 ⇔ 勝率5割 競技ごとの得点機会数や成功率の差を吸収できる単一 モデルを構築したい!

Slide 13

Slide 13 text

球技の本質 競技ごとの得点機会 数や成功率の差を吸 収できる単一モデル チームの得点能力差 (横軸)-勝率(縦軸) ロジスティック回帰? E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)

Slide 14

Slide 14 text

球技の本質 競技ごとの得点機会 数や成功率の差を吸 収できる単一モデル チームの得点能力差 (横軸)-勝率(縦軸) ロジスティック回帰? E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) そうです!!

Slide 15

Slide 15 text

球技の本質 競技ごとの得点機会 数や成功率の差を吸 収できる単一モデル チームの得点能力差 (横軸)-勝率(縦軸) ロジスティック回帰? E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) そうです!! , = 1 1 + exp − −  , :チーム, の実力(レーティング)  : 競技の変換パラメータ  . : チームのに対する予測勝率 (Eloレーティングと同様のモデル)

Slide 16

Slide 16 text

モデルの構築  find  that minimize subject to E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) , = 1 1 + exp − − = ℎ , − , 2 ( = 1, ⋯ , ), , : past results  過去の試合結果と予測勝率 の誤差(二乗和)が最小となるよ うな各チームレーティング(実力 値)と競技パラメータを導出する 実際は得点割合を説明するパラ メータの導出が間に入っていま す.[Konaka(2019), to be published]

Slide 17

Slide 17 text

モデル構築に利用した試合 結果 オリンピック予選,大規模世界大 会,大陸選手権など. 原則2014年~2016年7月 各種目およそ250~450試合 専門家(というか人間)の苦手 数百試合の試合結果を記憶し, かつ一貫したモデルで実力を評価 すること E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512) [Konaka(2019), to be published]

Slide 18

Slide 18 text

まとめ 過去数年の試合結果+ロジスティック回帰+対比較法 世界ランキングよりも正確 専門家よりも正確 な実力評価手法が構築できた. 「どの相手に何を成し遂げた(=得失点の記録)のか?」のみ を平等に評価するモデル 電子情報通信学会英文誌で出版予定. https://search.ieice.org/bin/summary_advpub.php?id=2018ED P7315 E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)

Slide 19

Slide 19 text

追記(5/13) 東京オリンピックでも同様の予測を行う予定です. この方法で他の競技の予測に興味のある(関係者の)方,ご連絡お待 ちしております! データ取得・整形に人手が足りていません! 個人競技(卓球,バドミントン,などなど E.KONAKA@SPORTS ANALYST MEETUP #2 (20190512)