2022年1月11日に電子情報通信学会システム数理と応用研究会(MSS)で発表したスライドです.
https://www.ieice.org/ken/program/index.php?tgs_regid=276586825ef612fbbfb5fc45adddf2e3116cfc34c4793e52a4797384e6c893ca&tgid=IEICE-MSS
得点差と残り時間から予測勝率を出力する数理モデルをB.LEAGUEに対して作成してみました.得失点差に対する単調性が既存手法との違いです.
B.LEAGUE におけるバスケットボールのリアルタイム勝利確率モデルの構築名城大学理工学研究科杉江幸治,小中英嗣
View Slide
目次研究背景モデリング手法の概要アルゴリズムモデリング結果・有効性の確認まとめ・今後の予定1
研究背景スポーツや将棋など各局面における形勢判断や予測勝率算出のための数理モデルの構築が盛ん2盤面 形勢数理モデル将棋における盤面から形勢判断
研究背景スポーツや将棋など各局面における形勢判断や予測勝率算出のための数理モデルの構築が盛ん3バスケットボールの試合 予測勝率
研究背景スポーツや将棋など各局面における形勢判断や予測勝率算出のための数理モデルの構築が盛ん4Play-by-play予測勝率数理モデルPlay-by-playデータ
研究背景バスケットボールにおけるリアルタイム勝敗確率モデリング手法勝利確率の経験的な推定値を用いる手法一般的なLOESS(locally weighted scatter plot smoothing)手法をロジスティック回帰に拡張した手法プロビット回帰モデルで算出したリアルタイム勝利確率に平滑化フィルタリングを行う手法5
研究背景バスケットボールにおけるリアルタイム勝敗確率モデリング手法勝利確率の経験的な推定値を用いる手法一般的なLOESS(locally weighted scatter plot smoothing)手法をロジスティック回帰に拡張した手法プロビット回帰モデルで算出したリアルタイム勝利確率に平滑化フィルタリングを行う手法• 外れ値への対処法の合理性• 得失点差に対する予測勝率の単調性が保証されていない 6課題
研究背景目的各試合時刻ごとに得点差に対して勝敗確率が単調性を保つようなモデル化方法を提案すること提案手法に対して予測精度,対数損失,較正値に基づき有効性を確認すること7
モデリング手法の概要提案手法各時間ごとの経験的勝敗確率に対してロジスティック回帰を行うことで予測勝敗確率をモデリングする手法8
各時間ごとの経験的勝敗確率の計算経験的勝敗確率の定義𝑤 Δ𝑠, 𝑡 =𝑂𝑤Δ𝑠, 𝑡𝑂(Δ𝑠, 𝑡)𝑡: 経過時間𝑖,𝑗: チーム添え字𝑠𝑖 ,𝑠𝑗: チーム 𝑖, 𝑗 の得点Δ𝑠: 𝑠𝑖 - 𝑠𝑗𝑂 Δ𝑠, 𝑡 : 経過時間 𝑡 ごとのΔ𝑠の発生回数𝑂𝑤Δ𝑠, 𝑡 : 𝑖 が試合に勝利したときの経過時間 𝑡 ごとのΔ𝑠の発生回数9
一般化線形モデルのあてはめ𝑤(Δ𝑠, 𝑡) に対して,各 𝑡 においてシグモイド関数に基づいて一般化線形モデルのあてはめを行うことで予測勝敗確率 ෝ𝑤(Δ𝑠, 𝑡) を構築する.10
アルゴリズム1. プレイ単位のデータ (以降,Play-by-play データ) を 𝑁𝑠試合分用意する.2. 試合単位で Play-by-play データを選択し,経過時間 𝑡 ごとにホームチーム 𝑖 の点差 Δ𝑠 を計算する.これを全試合に対して行う.このときクオーター数が 4 つではない試合 (延長戦など) は除外する.3. 𝑡 ごとの Δ𝑠 の発生回数 𝑂(Δ𝑠, 𝑡) とチーム 𝑖 が試合に 勝利したときの𝑡 ごとの Δ𝑠 の発生回数 𝑂𝑤Δ𝑠, 𝑡 を計算する.11
アルゴリズム4. 𝑂(Δ𝑠, 𝑡) と 𝑂𝑤Δ𝑠, 𝑡 から経験的勝敗確率 𝑤(Δ𝑠, 𝑡) を計算する.5. 𝑤(Δ𝑠, 𝑡) に対してシグモイド関数に基づいて一般化線形モデルのあてはめを行い,ෝ𝑤(Δ𝑠, 𝑡) を構築する.この処理を 𝑡 = 0, 1, · · · , 2400[s] に対して行う.12
モデリング結果・有効性の確認利用データ本研究の対象は B.LEAGUE, 特に B1 リーグとする.基本データとして,B1 リーグの2016年9月から2019年10月6日までの全 1736 試合の結果 (Play-by-play データ) を利用13
モデリング結果・有効性の確認1. Play-by-play データを試合単位でランダムに訓練用と検証用に分ける.また,データの割合は 8:2 とする.2. 訓練用の Play-by-play データを用いて,予測勝敗確率 ෝ𝑤(Δ𝑠, 𝑡) を構築する.3. 検証用の Play-by-play データから試合単位で Δ𝑠, 𝑡 を 算出する.4. 作成した ෝ𝑤(Δ𝑠, 𝑡) と (Δ𝑠, 𝑡) を用いて各時刻 𝑡 ごとに予測正解率,対数損失,較正値を計算する.5. 1-4 を 5 回繰り返す.14
モデリング結果・有効性の確認 予測正解率:実際の試合の最終的な勝敗と, ෝ𝑤(Δ𝑠, 𝑡) > 0.5 が一致する割合. 対数損失:実際の試合の最終的な勝敗を 𝑤𝑎∈ {0, 1} としたとき,以下の値.− (𝑤𝑎log2ෝ𝑤 Δ𝑠, 𝑡 + (1 − 𝑤𝑎 ) log2 (1 − ෝ𝑤 Δ𝑠, 𝑡 )) 較正値:各時刻 𝑡 ごとのホームチームの (予測勝率の和)/(実勝利数)15
モデリング結果・有効性の確認16
モデリング結果・有効性の確認17
モデリング結果・有効性の確認ෝ𝑤(Δ𝑠, 𝑡)は 𝑡 が大きくなるにつれて,一般線形モデルのゲインが高くなっている試合終盤での得点は勝敗に大きく関わることが考えられる.18
モデリング結果・有効性の確認ෝ𝑤(0, 0) = 0.5325B1リーグではわずかにホームアドバンテージがあることを示している.19
モデリング結果・有効性の確認検証回数 平均値1 回目 0.74492 回目 0.72673 回目 0.72694 回目 0.74775 回目 0.741220
モデリング結果・有効性の確認試合が終了に近づくにつれて予測正解率が高くなっている試合が終了に近づくにつれて勝敗結果が決定的になっていることを示している21
モデリング結果・有効性の確認試合が終了に近づくにつれて対数損失の値が低くなっている試合が終盤になるにつれて予測正解率が高くなっていることを示している22
モデリング結果・有効性の確認全ての時刻において対数損失が 1 より小さい予測勝利確率は全体的にでたらめな予想より適切である23
モデリング結果・有効性の確認今回の予測勝敗確率はおおむね勝敗確率を適切に評価していることがわかる.検証回数 平均値 最小値 最大値1 回目 1.0442 1.0051 1.08382 回目 1.0022 0.9560 1.04363 回目 1.0131 0.9850 1.05524 回目 1.0033 0.9713 1.05945 回目 0.9400 0.8970 1.021624
まとめ・今後の予定まとめB1リーグについて𝑡ごとにΔ𝑠に対して勝敗確率が単調性を保つようなモデル化方法を提案し,2016年9月から2019年10月6日までの結果に基づきモデリングを行ったB1リーグではホームチームの勝率が53.5%程度であるホームアドバンテージがあることを示した.予測精度や対数損失,較正値を元にモデルの有効性を確認し,その妥当性を示した25
まとめ・今後の予定今後の予定ボール保持・非保持を考慮したリアルタイム予測勝敗確率の構築リアルタイム予測勝敗確率を用いた選手のインパクトメトリクス (選手の勝敗に対する貢献を単一の指標であらわすことを目的とするもの) の提案および検証26