電子情報通信学会2023年総合大会 基礎・境界ソサイエティ特別企画「エンターテインメントとシステム数理・制御通信」で発表したスライドです.
スポーツデータアナリティクスのうち,「良いランキングの設計方法と,その予測モデル構築への活用」に着目し,著者の成果を含めて紹介しています.
スポーツデータアナリティクス:ランキングおよび予測モデル構築手法を中心に小中 英嗣 (名城大学情報工学部)2022/3/8 電子情報通信学会総合大会2023 1
View Slide
自己紹介⚫氏名:小中 英嗣(こなか えいじ)⚫所属:名城大学情報工学部情報工学科⚫研究分野⚫システム制御理論⚫連続・離散ハイブリッドシステム⚫最適化による設計⚫スポーツアナリティクス⚫レーティング・ランキング手法⚫メトリクス(評価指標)開発⚫スポーツアナリティクスへ至る経緯⚫趣味:スポーツ観戦(結構何でも観る)⚫得点過程→確率過程では?⚫予測モデルを作ってみる⚫ランキングや大会制度の不備を数理的に指摘する⚫バレーボール各国代表チームのレーティング手法の提案および結果予測・大会形式評価への応用(2017)⚫J1 リーグ 2 ステージ+ポストシーズン制度の統計的分析(2016)2022/3/8 電子情報通信学会総合大会2023 2
エンターテインメントとしてのスポーツスポーツを「する」 スポーツを「みる」2022/3/8 電子情報通信学会総合大会2023 3
エンターテインメントとしてのスポーツスポーツを「する」 スポーツを「みる」2022/3/8 電子情報通信学会総合大会2023 4
スポーツの「何をみる」「みせる」?⚫スポーツの「何をみる」?⚫チーム⚫選手⚫スタジアム⚫飲食⚫技術⚫戦術・戦略2022/3/8 電子情報通信学会総合大会2023 5
スポーツの「何をみる」「みせる」?⚫スポーツの「何をみる」?⚫チーム⚫選手⚫スタジアム⚫飲食⚫技術⚫戦術・戦略⚫データ2022/3/8 電子情報通信学会総合大会2023 6
Definition of “sports”⚫PLAY⚫Spontaneous PLAY⚫Organized PLAY = GAMES⚫Non-competitive GAMES⚫Competitive GAMES = CONTESTS⚫Intellectual CONTESTS⚫Physical CONTESTS = SPORTS(Sports | Definition, History, Examples, & Facts |Britannica)⚫「スポーツ」とは…⚫物理的・身体的で⚫競争を伴う⚫組織だった遊び2022/3/8 電子情報通信学会総合大会2023 7
スポーツとデータ⚫スポーツとデータの関係⚫スポーツとデータは関連深い?相性が良い?2022/3/8 電子情報通信学会総合大会2023 8
スポーツとデータ⚫スポーツとデータの関係⚫スポーツとデータは関連深い?相性が良い?⚫スポーツとデータは相性が良い⚫そもそもスポーツとは「運動を数値にして評価する活動」⚫距離,時間,成功回数…⚫得点=「ボールがある領域を通過した回数」⚫ルールが明確である2022/3/8 電子情報通信学会総合大会2023 9
スポーツと評価⚫そもそもスポーツとは「運動を数値にして評価する活動」⚫複数試合の結果→順位・ランキング⚫多くの大会は順序を決めるために開催されている2022/3/8 電子情報通信学会総合大会2023 10
今日の内容⚫そもそもスポーツとは「運動を数値にして評価する活動」⚫複数試合の結果→順位・ランキング⚫多くの大会は順序を決めるために開催されている⚫今日の内容⚫適切なランキング手法⚫予測モデルへの応用⚫事例紹介2022/3/8 電子情報通信学会総合大会2023 11
スポーツとランキングなぜ必要?いつ必要?⚫大会:順序を決める場⚫勝利数・勝率・勝点⚫均等な対戦:異論が出にくい⚫不均一な状況では?⚫チーム数が多すぎる⚫地理的に離れているランキングの活用方法⚫大会制度設計への活用⚫シード⚫グループ分け⚫ファンへの周知2022/3/8 電子情報通信学会総合大会2023 12
採用されているランキング手法[Stefani, 2011]⚫オリンピック採用種目を中心に公式ランキング手法を調査⚫159競技・種目⚫分類⚫None: 60⚫Subjective: 2⚫Accumulative: 84⚫Adjustive: 13⚫Accumulative⚫一定期間の試合・大会結果に基づく加算⚫Adjustive⚫試合ごとに調整2022/3/8 電子情報通信学会総合大会2023 13
「性能の悪い」ランキングランキングの「性能」とは何?⚫「ランキングが高いほうが勝率が高い」⚫「ランキング差が大きいほうが勝率が1に近づく」「性能の悪い」ランキングの作られ方⚫対戦相手の実力を考慮しない⚫試合ではなく大会の結果を考慮してしまう⚫順位とランキングポイントの関係に根拠がない⚫複数の大会をまとめる設計が雑⚫作り方が雑なAccumulativeなランキング→事例紹介2022/3/8 電子情報通信学会総合大会2023 14
(初期の)FIFAランキング(サッカー)⚫各試合の勝敗を対戦相手・得失点差・重要度の区別なく反映させる⚫初期のFIFAランキング⚫1993-1998⚫勝利+3,引き分け+1⚫これのみ(!)⚫さすがにランキングの体を成していないので,修正された2022/3/8 電子情報通信学会総合大会2023 15日本最高位:9位(1998年2月)
(初期の)FIFAランキング(サッカー)⚫各試合の勝敗を対戦相手・得失点差・重要度の区別なく反映させる⚫ワールドカップ1998⚫グループステージでの勝点⚫相関係数-0.232022/3/8 電子情報通信学会総合大会2023 16
FIFAランキングの改善1998大会 (相関係数-0.23) 2022大会(相関係数-0.46)2022/3/8 電子情報通信学会総合大会2023 17
FIFAランキングの改善1998大会 (相関係数-0.23) 2022大会(相関係数-0.46)改善(後述)*複数回計算方法が改善されている2022/3/8 電子情報通信学会総合大会2023 18
(旧)FIVBランキング(バレーボール)⚫各試合の結果ではなく大会の順位を反映する⚫大会予選の条件/参加枠⚫各順位ごとのポイント付与がAd hoc⚫(旧)FIVBランキング⚫バレーボール⚫世界大会を独占する開催国が開催国枠で出場してランキングポイントを得る⚫枠が少ない大陸が過小評価⚫(Konaka[2019])2022/3/8 電子情報通信学会総合大会2023 19
(旧)FIVBランキング⚫各試合の結果ではなく大会の順位を反映する⚫大会予選の条件/参加枠⚫(旧)FIVBランキング(バレーボール)⚫世界大会を独占する開催国が開催国枠で出場してランキングポイントを得る⚫枠が少ない大陸が過小評価⚫世界選手権におけるヨーロッパ各国2022/3/8 電子情報通信学会総合大会2023 20
(旧)FIVBランキング⚫各試合の結果ではなく大会の順位を反映する⚫大会予選の条件/参加枠⚫(旧)FIVBランキング(バレーボール)⚫世界大会を独占する開催国が開催国枠で出場してランキングポイントを得る⚫枠が少ない大陸が過小評価⚫世界選手権におけるヨーロッパ各国2022/3/8 電子情報通信学会総合大会2023 21「ワールドカップ」への出場枠は2のみ!
(旧)FIVBランキングの欠陥⚫横軸:ランキングポイント,縦軸:提案手法(後述)の評価⚫提案手法:各チームの得失点に基づく評価値⚫FIVBランキングポイントは得点の能力を定量化していない⚫世界大会の予測精度も提案手法が高い⚫565, 544/733試合⚫2010-2018.2022/3/8 電子情報通信学会総合大会2023 22
(旧)FIVBランキングの欠陥⚫横軸:ランキングポイント⚫縦軸:提案手法=各チームの得失点に基づく評価値(後述)⚫FIVBランキングポイントは得点の能力を定量化していない⚫世界大会の予測精度も提案手法が高い⚫565, 544/733試合⚫2010-2018.2022/3/8 電子情報通信学会総合大会2023 23
「良い」ランキングの例⚫プロテニス(ATP)ランキング⚫ランキングポイント比が勝率と対応する(右図)2022/3/8 電子情報通信学会総合大会2023 24
「良い」ランキングの例⚫プロテニス(ATP)ランキング⚫ランキングポイント比が勝率と対応する(右図)⚫例:選手A(ランキングポイント1500)と選手B(ランキングポイント1000)が対戦⚫Aの予測勝率= 15001500+1000= 0.62022/3/8 電子情報通信学会総合大会2023 25
「良い」ランキングの例⚫プロテニス(ATP)ランキング⚫ランキングポイント比が勝率と対応する(右図)⚫前提条件⚫トーナメント戦⚫有力選手への出場義務⚫順位とランキングポイントの関係が適切⚫上位選手を強制的に参加させる大会を数多く開けないとうまくいかない⚫グランドスラムには全上位選手が出場2022/3/8 電子情報通信学会総合大会2023 26
「良い」ランキングの例⚫プロテニス(ATP)ランキング⚫ランキングポイント比が勝率と対応する⚫前提条件⚫トーナメント戦⚫有力選手への出場義務⚫順位とランキングポイントの関係が適(右表)⚫上位選手を強制的に参加させる大会を数多く開けないとうまくいかない⚫グランドスラムには全上位選手が出場2022/3/8 電子情報通信学会総合大会2023 27W F SF QF R16 R32 R64GS 2000 1200 720 360 180 90 45ATP100096D1000 600 360 180 90 45 25ATP50048D500 300 180 90 45 20ATP25048D250 150 90 45 20×0.6×0.6×0.5×0.5×0.5
「公式世界ランキング」って正しいの?⚫競技ごとの「公式世界ランキング」は各国の実力を正しく表しているのか?⚫ランキングの正しさ⚫ランキングが高いほうが勝つ可能性が高い⚫リオ五輪 球技予測プロジェクト2022/3/8 電子情報通信学会総合大会2023 28
「公式世界ランキング」って正しいの?⚫競技ごとの「公式世界ランキング」は各国の実力を正しく表しているのか?⚫ランキングの正しさ⚫ランキングが高いほうが勝つ可能性が高い⚫リオ五輪 球技予測プロジェクト⚫球技5競技10種目を予測する⚫ バスケットボール,ハンドボール,ホッケー,バレーボール,水球⚫ 予測内容:各試合の勝敗,メダルの有無/色⚫予測方法⚫ 世界ランキング⚫ 雑誌・新聞予測⚫ 小中英嗣の予測⚫ Konaka, “A Unified Statistical Rating Method forTeam Ball Games and Its Application to Predictionsin the Olympic Games”2022/3/8 電子情報通信学会総合大会2023 29
リオ五輪予測プロジェクト⚫各試合の勝敗予測⚫公式世界ランキング:「ランキングが高いほうが勝つ」⚫メダル予測⚫公式世界ランキング:ランキング1-3位⚫雑誌・新聞の予測⚫ 雑誌:Sports Illustrated (アメリカのスポーツ専門雑誌)⚫ 新聞:USA Today (アメリカの全国紙)2022/3/8 電子情報通信学会総合大会2023 30
リオ五輪予測プロジェクト⚫各試合の勝敗予測⚫公式世界ランキング:「ランキングが高いほうが勝つ」⚫メダル予測⚫公式世界ランキング:ランキング1-3位⚫雑誌・新聞の予測⚫ 雑誌:Sports Illustrated (アメリカのスポーツ専門雑誌)⚫ 新聞:USA Today (アメリカの全国紙)2022/3/8 電子情報通信学会総合大会2023 31試合数 正解公式ランキング 370 238小中英嗣 370 ???メダル数 正解(メダル有無)正解(メダル色)公式ランキング30 14 6雑誌(SI) 30 16 8新聞(USAToday)30 14 7小中英嗣 30 ??? ???
リオ五輪予測プロジェクト⚫各試合の勝敗予測⚫公式世界ランキング:「ランキングが高いほうが勝つ」⚫メダル予測⚫公式世界ランキング:ランキング1-3位⚫雑誌・新聞の予測⚫ 雑誌:Sports Illustrated (アメリカのスポーツ専門雑誌)⚫ 新聞:USA Today (アメリカの全国紙)2022/3/8 電子情報通信学会総合大会2023 32試合数 正解公式ランキング 370 238小中英嗣 370 262*メダル数 正解(メダル有無)正解(メダル色)公式ランキング30 14 6雑誌(SI) 30 16 8新聞(USAToday)30 14 7小中英嗣 30 ??? ???(* p<0.01 で有意差あり)
リオ五輪予測プロジェクト⚫各試合の勝敗予測⚫公式世界ランキング:「ランキングが高いほうが勝つ」⚫メダル予測⚫公式世界ランキング:ランキング1-3位⚫雑誌・新聞の予測⚫ 雑誌:Sports Illustrated (アメリカのスポーツ専門雑誌)⚫ 新聞:USA Today (アメリカの全国紙)2022/3/8 電子情報通信学会総合大会2023 33試合数 正解公式ランキング 370 238小中英嗣 370 262*メダル数 正解(メダル有無)正解(メダル色)公式ランキング30 14 6雑誌(SI) 30 16 8新聞(USAToday)30 14 7小中英嗣 30 19 10(* p<0.01 で有意差あり)
リオ五輪予測プロジェクト⚫各試合の勝敗予測⚫公式世界ランキング:「ランキングが高いほうが勝つ」⚫メダル予測⚫公式世界ランキング:ランキング1-3位⚫統計予測を扱う企業(Gracenote)2022/3/8 電子情報通信学会総合大会2023 34試合数 正解公式ランキング 370 238小中英嗣 370 262*メダル数 正解(メダル有無)正解(メダル色)公式ランキング30 14 6雑誌(SI) 30 16 8新聞(USAToday)30 14 7統計予測(Gracenote)30 14 10小中英嗣 30 19 10(* p<0.01 で有意差あり)
リオ五輪予測プロジェクト:まとめ⚫公式ランキングは実力を適切に評価できていないのではないか?⚫現場を取材している記者・専門家も実力を適切に評価できていないのではないか?⚫小中英嗣は何をしたのか?⚫統計予測企業も公式ランキングや専門家を出し抜いている2022/3/8 電子情報通信学会総合大会2023 35試合数 正解公式ランキング 370 238小中英嗣 370 262*メダル数 正解(メダル有無)正解(メダル色)公式ランキング30 14 6雑誌(SI) 30 16 8新聞(USAToday)30 14 7統計予測(Gracenote)30 14 10小中英嗣 30 19 10
「実力」とは何か?人間の専門家の特徴⚫◎競技特性・構造の定性的な理解⚫×データの記憶⚫×みられる試合数は限られる⚫×「実力」評価に必要・不要な要素を適切に分別できない⚫余分な情報を得られすぎる「実力」とは何か?2022/3/8 電子情報通信学会総合大会2023 36
「実力」とは何か?人間の専門家の特徴⚫◎競技特性・構造の定性的な理解⚫×データの記憶⚫×みられる試合数は限られる⚫×「実力」評価に必要・不要な要素を適切に分別できない⚫余分な情報を得られすぎる「実力」とは何か?⚫5競技の共通点:得点が多いほうが勝ち⚫「実力」=「得点を取る能力」「失点を抑える能力」⚫仮説:実力評価に最も有効なデータは過去の結果(得失点)である⚫「1点取られる間に何点取れるか」=得失点比⚫専門家による技術・戦術の評価は必ずしも実力を定量化しない2022/3/8 電子情報通信学会総合大会2023 37
球技の本質電子情報通信学会総合大会2023⚫「自分が1点取られる間に何点取れるか?」=「得失点比」が本質⚫得失点(または無得点)の最小単位を繰り返す確率過程⚫得失点比は対戦チーム間の実力差で定まる(という仮定)⚫対比較法⚫(得失点比)=1 ⇔ 勝率5割⚫競技ごとの得点機会数や成功率の差を吸収できる単一モデルを構築したい!2022/3/8 38
球技の本質⚫競技ごとの得点機会数や成功率の差を吸収できる単一モデル⚫チームの得点能力差(横軸)-勝率(縦軸)⚫ロジスティック回帰?電子情報通信学会総合大会20232022/3/8 39
球技の本質⚫競技ごとの得点機会数や成功率の差を吸収できる単一モデル⚫チームの得点能力差(横軸)-勝率(縦軸)⚫ロジスティック回帰?電子情報通信学会総合大会2023そうです!!2022/3/8 40
球技の本質⚫競技ごとの得点機会数や成功率の差を吸収できる単一モデル⚫チームの得点能力差(横軸)-勝率(縦軸)⚫ロジスティック回帰?電子情報通信学会総合大会2023そうです!!ෝ𝑤𝑖,𝑗=11 + exp −𝐷𝑘𝑟𝑖− 𝑟𝑗⚫ 𝑟𝑖, 𝑟𝑗:チーム𝑖, 𝑗の実力(レーティング)⚫𝐷𝑘: 競技𝑘の変換パラメータ⚫ෝ𝑤𝑖.𝑗: チーム𝑖の𝑗に対する予測勝率⚫(Eloレーティングと同様のモデル)2022/3/8 41
モデルの構築⚫ find⚫ that minimize⚫subject to電子情報通信学会総合大会2023ෝ𝑤𝑖,𝑗=11 + exp −𝐷𝑘𝑟𝑖− 𝑟𝑗𝐽 = 𝑓𝑜𝑟 𝑎𝑙𝑙𝑚𝑎𝑡𝑐ℎ𝑒𝑠𝑤𝑖,𝑗− ෝ𝑤𝑖,𝑗2𝑟𝑖(𝑖 = 1, ⋯ , 𝑁𝑇), 𝐷𝑘𝑤𝑖,𝑗: past results⚫ 過去の試合結果と予測勝率の誤差(二乗和)が最小となるような各チームレーティング(実力値)と競技パラメータを導出する⚫実際は得点割合を説明するパラメータの導出が間に入っています.[Konaka(2019)]⚫本質的にイロ・レーティングと等価2022/3/8 42
「良い」ランキングの決定版:イロレーティングチェスとランキング⚫チェス⚫選手が多く,総当たりは無理⚫アルパド・イロ⚫チェスプレイヤーとしても有名な物理学者⚫試合結果から強さを推定する手法を提案⚫「イロ・レーティング(Elo Rating)」アルパド・イロ(ÉLŐ ÁRPÁD IMRE)2022/3/8 電子情報通信学会総合大会2023 43
「良い」ランキングの決定版:イロレーティングELO RATING⚫各選手がレーティング(強さを数値化したもの)を持つ⚫レーティング差が予測勝率を定める⚫予測勝率と結果の差に基づきレーティングを修正する⚫「予測」→「修正」の繰り返し2022/3/8 電子情報通信学会総合大会2023 44
イロレーティングの具体例予測過程⚫試合前:𝑟𝐴= 1800, 𝑟𝐵= 1600⚫𝑟𝐴, 𝑟𝐵: 選手A,Bのレーティング⚫予測勝率⚫𝑝𝐴,𝐵= 11+101600−1800400≃ 0.7597修正過程⚫試合が多い場合⚫Aが勝利⚫ 𝑟𝐴← 𝑟𝐴+ 16 × 1 − 0.7597 ≃ 1804⚫ 𝑟𝐵← 𝑟𝐵+ 16 × 0 − 0.2413 ≃ 1596⚫ ±3.84⚫Bが勝利⚫ 𝑟𝐴← 𝑟𝐴+ 16 × 0 − 0.7597 ≃ 1787⚫ 𝑟𝐵← 𝑟𝐵+ 16 × 1 − 0.2413 ≃ 1613⚫ ±12.162022/3/8 電子情報通信学会総合大会2023 45
イロレーティングの具体例予測過程⚫試合前:𝑟𝐴= 1800, 𝑟𝐵= 1600⚫𝑟𝐴, 𝑟𝐵: 選手A,Bのレーティング⚫予測勝率⚫𝑝𝐴,𝐵= 11+101600−1800400≃ 0.7597⚫レーティング差0=予測勝率0.5⚫レーティング差大→予測勝率が1に近づくシグモイド関数2022/3/8 電子情報通信学会総合大会2023 46
イロレーティングの具体例修正過程の解釈⚫強いほうが勝つ→予測と実際が近い→レーティングをそんなに修正しなくてよい→修正量が少ない⚫弱いほうが勝つ→予測と実際が遠い→レーティングをたくさん修正するべき→修正量が多い修正過程⚫試合が多い場合⚫Aが勝利⚫ 𝑟𝐴← 𝑟𝐴+ 16 × 1 − 0.7597 ≃ 1804⚫ 𝑟𝐵← 𝑟𝐵+ 16 × 0 − 0.2413 ≃ 1596⚫ ±3.84⚫Bが勝利⚫ 𝑟𝐴← 𝑟𝐴+ 16 × 0 − 0.7597 ≃ 1787⚫ 𝑟𝐵← 𝑟𝐵+ 16 × 1 − 0.2413 ≃ 1613⚫ ±12.162022/3/8 電子情報通信学会総合大会2023 47
イロレーティングの具体例修正過程の解釈⚫強いほうが勝つ→予測と実際が近い→レーティングをそんなに修正しなくてよい→修正量が少ない⚫弱いほうが勝つ→予測と実際が遠い→レーティングをたくさん修正するべき→修正量が多い修正過程⚫試合が多い場合⚫Aが勝利⚫ 𝒓𝑨← 𝒓𝑨+ 𝟏𝟔 × 𝟏 − 𝟎. 𝟕𝟓𝟗𝟕 ≃ 𝟏𝟖𝟎𝟒⚫ 𝒓𝑩← 𝒓𝑩+ 𝟏𝟔 × 𝟎 − 𝟎. 𝟐𝟒𝟏𝟑 ≃ 𝟏𝟓𝟗𝟔⚫ ±𝟑. 𝟖𝟒⚫Bが勝利⚫ 𝑟𝐴← 𝑟𝐴+ 16 × 0 − 0.7597 ≃ 1787⚫ 𝑟𝐵← 𝑟𝐵+ 16 × 1 − 0.2413 ≃ 1613⚫ ±12.162022/3/8 電子情報通信学会総合大会2023 48
イロレーティングの具体例修正過程の解釈⚫強いほうが勝つ→予測と実際が近い→レーティングをそんなに修正しなくてよい→修正量が少ない⚫弱いほうが勝つ→予測と実際が遠い→レーティングをたくさん修正するべき→修正量が多い修正過程⚫試合が多い場合⚫Aが勝利⚫ 𝑟𝐴← 𝑟𝐴+ 16 × 1 − 0.7597 ≃ 1804⚫ 𝑟𝐵← 𝑟𝐵+ 16 × 0 − 0.2413 ≃ 1596⚫ ±3.84⚫Bが勝利⚫ 𝒓𝑨← 𝒓𝑨+ 𝟏𝟔 × 𝟎 − 𝟎. 𝟕𝟓𝟗𝟕 ≃ 𝟏𝟕𝟖𝟕⚫ 𝒓𝑩← 𝒓𝑩+ 𝟏𝟔 × 𝟏 − 𝟎. 𝟐𝟒𝟏𝟑 ≃ 𝟏𝟔𝟏𝟑⚫ ±𝟏𝟐. 𝟏𝟔2022/3/8 電子情報通信学会総合大会2023 49
様々な競技でのイロレーティング系ランキングの採用ラグビー 「番狂わせ」の定量化⚫日本初戦が番狂わせランキングトップ (2015)2022/3/8 電子情報通信学会総合大会2023 50World Rugby. "Rankings Explanation"
様々な競技でのイロレーティング系ランキングの採用ランキングポイント差と得点差(RWC 2003-2015大会)「番狂わせ」の定量化⚫日本初戦が番狂わせランキングトップ (2015)⚫「番狂わせ」=ランキングポイントが少ないほうが勝つ:わずか15% (2003-2015大会)⚫最大ランキングポイント差(2015大会まで):-13.09⚫日本対南アフリカ(2015大会)2022/3/8 電子情報通信学会総合大会2023 51
様々な競技でのイロレーティング系ランキングの採用⚫FIFA女子サッカーランキング⚫2003年~⚫予測勝率の関数が少し違う⚫得失点差,試合種別による重み⚫FIFA男子サッカーランキング⚫2018年~⚫女子から遅れること15年.⚫FIVBバレーボールランキング⚫2020年~⚫セット数に基づくイロ系レーティング2022/3/8 電子情報通信学会総合大会2023 52
結果的にイロレーティングの変種となっていた例(とその改善)大相撲 番付⚫番付の近い力士と対戦⚫勝ち越し・負け越し数と番付の上下量が対応⚫以下の点でランキングとしての性能が下がる⚫経験的⚫特殊な運用の番付(横綱・大関)⚫数理的なレーティングで予測精度が改善⚫横綱としてふさわしいか?の定量的な基準番付と数理的手法の比較(予測正解率)2022/3/8 電子情報通信学会総合大会2023 53小中.「大相撲における力士の実力の定量的評価指標の提案」
結果的にイロレーティングの変種となっていた例(とその改善)大相撲 番付⚫番付の近い力士と対戦⚫勝ち越し・負け越し数と番付の上下量が対応⚫以下の点でランキングとしての性能が下がる⚫経験的⚫特殊な運用の番付(横綱・大関)⚫数理的なレーティングで予測精度が改善⚫横綱としてふさわしいか?の定量的な基準番付と数理的手法の比較(予測正解率)2022/3/8 電子情報通信学会総合大会2023 54小中.「大相撲における力士の実力の定量的評価指標の提案」
どの「平幕優勝」がすごいの?の定量化2020年1月場所 「最も驚きの」幕内優勝10傑(~2020年3月)year month nameEng winspredictedwinslogloss1991 7 Kotofuji 14 5.6273 1.57552020 1 Tokushoryu 14 5.5564 1.47681984 9 Tagaryu 13 6.1411 1.29612008 5 Kotooshu 14 6.8338 1.25341972 1 Tochiazuma 11 6.2910 1.22661975 7 Kongo 13 6.8946 1.20542018 1 Tochinoshin 14 6.6507 1.18921961 5Sadanoyama12 7.0139 1.11611976 9 Kaiketsu 14 6.6405 1.11072000 3 Takatoriki 13 5.9884 1.10942022/3/8 55電子情報通信学会総合大会2023
横綱昇進の条件は妥当か?横綱⚫順位ではなく特殊な「身分」⚫内規(とされる)⚫大関で2場所連続優勝:現役横綱の人数に左右される⚫どこを基準とするべきか?⚫前頭の平均=0 (右図)2022/3/8 電子情報通信学会総合大会2023 56
横綱昇進の条件は妥当か?横綱⚫内規(とされる)⚫大関で2場所連続優勝:現役横綱の人数に左右される⚫どこを基準とするべきか?⚫前頭の平均=0 (右図)⚫稀勢の里関⚫2017年1月場所終了時:全力士中最高評価⚫1度のみの優勝で議論を呼ぶ2022/3/8 電子情報通信学会総合大会2023 57
で,東京オリンピックは?公式ランキングの改善⚫イロレーティング系への改善⚫バスケットボール⚫ホッケー⚫バレーボール⚫その他2種目(ハンドボール,水球)⚫公式ランキングを公開しなくなった提案手法と公式ランキングの比較2022/3/8 電子情報通信学会総合大会2023 58試合数 正解公式ランキング 354 250小中英嗣 354 ???
で,東京オリンピックは?公式ランキングの改善⚫イロレーティング系への改善⚫バスケットボール⚫ホッケー⚫バレーボール⚫その他2種目(ハンドボール,水球)⚫公式ランキングを公開しなくなった提案手法と公式ランキングの比較◦ 有意差無し(p=0.271>0.05)2022/3/8 電子情報通信学会総合大会2023 59試合数 正解公式ランキング 354 250小中英嗣 354 258
で,東京オリンピックは?公式ランキングの改善⚫イロレーティング系への改善⚫バスケットボール⚫ホッケー⚫バレーボール⚫その他2種目(ハンドボール,水球)⚫公式ランキングを公開しなくなった提案手法と公式ランキングの比較◦ 有意差無し(p=0.271>0.05)2022/3/8 電子情報通信学会総合大会2023 60試合数 正解公式ランキング 354 250小中英嗣 354 258数理的根拠を伴う,公正なランキングが広まりつつある
(余談)レーティングはスポーツだけではない!レーティングと順位づけ(ランキング)⚫レーティング=「何らかの基準に基づいて定量化すること」⚫ランキング=「何らかの基準に基づいて順序を定めること」2022/3/8 電子情報通信学会総合大会2023 61
(余談)レーティングはスポーツだけではない!レーティングと順位づけ(ランキング)⚫ランキング=「何らかの基準に基づいて順序を定めること」⚫Web検索エンジン(例:Google)⚫ページ表示の順序⚫ページ重要度の「レーティング」と「ランキング」⚫似た数理構造を活用可能2022/3/8 電子情報通信学会総合大会2023 62
その他のトピック選手評価指標の開発⚫野球:セイバーメトリクス⚫評価指標の内容⇔計測データの粒度⚫バスケットボール⚫プレイ単位データ→各選手の攻守の貢献の定量化⚫Personal Strength Evaluation in B.LEAGUE2022/3/8 電子情報通信学会総合大会2023 63
その他のトピックオープンデータの活用⚫シュート位置データ→ゴール期待値⚫サッカーにおけるゴール期待値⚫バスケットボール2022/3/8 電子情報通信学会総合大会2023 64
その他のトピックオープンデータの活用⚫シュート位置データ→ゴール期待値⚫サッカーにおけるゴール期待値⚫バスケットボール2022/3/8 電子情報通信学会総合大会2023 65
まとめ適切なランキングの設計⚫ランキングの良し悪し⚫ランキングの上下が試合結果の予測となっているべき⚫大会形式と合わせて慎重に設計されるべき⚫過大・過小評価による弊害⚫イロレーティング⚫勝率予測モデルと試合結果に基づく修正を繰り返す⚫様々なランキングがこちらに変更されつつある「順序をつける」⚫スポーツだけではない⚫Web検索など⚫抽象化:「評価を定量化して並べる」⚫数学的な構造の活用2022/3/8 電子情報通信学会総合大会2023 66
ありがとうございました!研究情報公開一覧⚫Webサイト⚫https://www-ie.meijo-u.ac.jp/~konaka/summary.html⚫SNS⚫@konakalab/Twitter⚫ブログ⚫note, qiita, livedoor Blog⚫発表スライド⚫https://speakerdeck.com/konakalabさわれるWEBアプリ⚫ポアソン分布を利用したサッカーシミュレーション⚫Bリーグにおける勝利確率(得失点差と残り時間)⚫男子プロテニス サービス位置・ランキングポイントと成功確率2022/3/8 電子情報通信学会総合大会2023 67
2022/3/8 電子情報通信学会総合大会2023 68