Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ITTF卓球世界ランキングのポイント比を用いた試合結果予測モデルの性能評価 / Perform...

Avatar for konakalab konakalab
November 12, 2025

ITTF卓球世界ランキングのポイント比を用いた試合結果予測モデルの性能評価 / Performance evaluation of match result prediction models using the point ratio of the ITTF Table Tennis World Ranking

電子情報通信学会システム数理と応用研究会(2025年11月13日)で発表したスライドです.

https://ken.ieice.org/ken/paper/20251113Tcok/

卓球の公式世界ランキングであるITTFランキングポイントがどのように試合結果を予測できるのか,およびその予測性能について議論しました.

Avatar for konakalab

konakalab

November 12, 2025
Tweet

More Decks by konakalab

Other Decks in Science

Transcript

  1. 研究背景 卓球の世界ランキング制度 • ランキングは毎週更新される →2025年10月28日時点では張本智和選手 が5500ポイントで4位となっている →松島輝空選手は15位で前の週のランキング から1位アップしている • 各選手のランキングポイントは直近12か月

    (52週)以内に取得した 「有効な大会ポイント」のうち,最も高い8大 会分(上位8大会)のポイント合計によって算 出される • 得られた大会ポイントには“有効期限”があり通 常その大会終了週から52週間後のランキング 発表時点で失効(除外)される
  2. 研究背景 国際大会の構成 • 2021年に国際卓球連盟(ITTF)の子会社 が運営する国際大会(WTT)が開始される • 大会(Grand Smash, Champions, Contenderなど)ごとの到達ラウンドに

    応じたポイントが与えられる 例 : Grand Smash 優勝者 2000pt Champions 優勝者 1000pt WTT シリーズ WTTフィーダー シリーズ WTTユースシリーズ WTT Grand Smash WTT Finals WTT Champions WTT Star Contender WTT Contender WTT Feeder WTT Youth Star Contender WTT Youth Contender 次のスライドでWTTシリーズの主なカテゴリ別のポイントについて説明をする
  3. 研究背景 国際大会のポイント 1位 2位 ベスト4 ベスト8 ベスト16 ベスト32 … Grand

    Smash 2000 1400 700 350 175 90 … Champions 1000 700 350 175 90 15 … Star Contender 600 420 210 105 55 25 … Contender 400 280 140 70 35 4 … • 上位のカテゴリの大会は得られるポイントが高く, 下位のカテゴリの大会は得られるポイントが低い この制度で計算されたランキングは実力を定量化できているはず…
  4. 勝敗予測モデル 使用データ • 今回使用するデータは2022年から2025年(9月25日)までに開催された WTTの大会およびオリンピックの試合を含む19,477試合を対象 • 取得したデータは各大会の試合結果および参加した大会時点での ランキングポイントである • 勝者・敗者のランキングポイントが欠損している試合や0ポイントと

    なっている試合を無効データとして除外し,利用可能なデータのみを残す →除外対象となった試合は2,477試合であった • 2022年から2024年までのデータ(12,494試合)を用いて予測モデルを作成し, 2025年のデータ(4,536試合)を用いて試合の予測および性能の評価を行う
  5. 勝敗予測モデル Bradley-Terryモデル① • 𝝅𝒊 = 𝝅𝒋 のとき𝒑𝒊,𝒋 = 𝟎. 𝟓となり互角を意味する

    • 𝝅𝒊 が𝝅𝒋 より十分に大きいとき𝒑𝒊,𝒋 は1に近似され選手𝒊 が勝つ確率が高いことを意味する • Bradley-Terryモデルは強さの比によって勝率を確率的に表すモデルである 𝑝𝑖,𝑗 = 𝜋𝑖 𝜋𝑖 + 𝜋𝑗 • 選手𝒊 が選手𝒋 に勝つ確率は以下の式で表される • 𝝅𝒊 :選手𝒊 の潜在的な強さ • 𝝅𝒋 :選手𝒋 の潜在的な強さ 本研究ではこのモデルを拡張したものを使用する
  6. 勝敗予測モデル Bradley-Terryモデル② • 𝜶はランキングポイント比が勝率に与える影響を調整するためのパラメータ • 𝜶 > 𝟏のときは上位選手の確率が強調される→ランキング差の効果が大きくなる • 𝜶

    < 𝟏のときは下位選手の確率が強調される→ランキング差の影響が小さくなる • 本研究で使用する選手𝒊 が選手𝒋 に勝つ確率は以下の式で定義する 𝑝𝑖,𝑗 = 𝑟𝑖 𝛼 𝑟𝑖 𝛼 + 𝑟𝑗 𝛼 • 𝒓𝒊 :選手𝒊 のITTF世界ランキングポイント • 𝒓𝒋 :選手𝒋 のITTF世界ランキングポイント • 今回の𝜶を推定した結果𝜶 = 𝟎. 𝟒𝟔𝟐という値が得られた
  7. 勝敗予測モデル 3-PLMモデル • 𝜶はランキングポイント比が勝率に与える影響を調整するためのパラメータ • 𝒄は勝率の範囲を[𝒄, 𝟏 − 𝒄]に制限する補正パラメータ →ランキングポイントに大きな違いがある対戦でも,同じレベルの大会に出場できているので

    勝率が極端に小さくなることはない,という仮説を表すために利用する • 先ほどのBradley-Terryモデルの式を勝率の上下限を設定するパラメータ 𝒄を導入し, 3パラメータ・ロジスティックモデル(3-PLM)として次のように拡張する • 𝒓𝒊 :選手𝒊 のITTF世界ランキングポイント • 𝒓𝒋 :選手𝒋 のITTF世界ランキングポイント • 今回の𝜶と𝒄を推定した結果𝜶 = 𝟏. 𝟎𝟓𝟔, 𝒄 = 𝟎. 𝟐𝟎𝟏という値が得られた 𝑝𝑖,𝑗 = 𝑐 + 1 − 2𝑐 𝑟𝑖 𝛼 𝑟𝑖 𝛼 + 𝑟𝑗 𝛼
  8. 評価方法 対数損失(LogLoss) • 予測確率が実際の結果に近いほど小さな値となり, 正解に対して低い確率を与えた場合には大きなペナルティを課す • 値が小さいほどモデルの確率出力が正確であることを意味する • 確率予測の性能を評価するために対数損失(LogLoss) を用いる

    各試合 𝒊 = 𝟏, … , 𝑵の正解ラベルを 𝒚𝒊 ∈{0,1}(勝ち=1, 負け=0), モデルの予測勝率を 𝒑𝒊 ∈ [𝟎, 𝟏]とすると LogLoss = − 1 𝑁 ෍ 𝑖=1 𝑁 𝑦𝑖 log 𝑝𝑖 + 1 − 𝑦𝑖 log 1 − 𝑝𝑖 モデルが単に勝敗を当てるだけでなく, その確率をどれだけ適切に割り当てられているかを評価することができる
  9. 評価方法 ECE (Expected Calibration Error) • 値が小さいほどモデルの予測確率が実際の勝率に近いことを意味する • ECEが小さいほど「予測確率=実際の勝率」に近く,よく較正されている 例:

    「予測0.8の試合が実際に80%勝っている」 →良い較正 「予測0.8なのに実際は60%しか勝っていない」→予測が過大評価 • ECE(Expected Calibration Error)は, 予測確率と実際の勝率の一致度(=信頼度の正確さ)を評価する指標 conf 𝑚 = 1 𝑛𝑚 ෍ 𝑖∈𝐵𝑚 𝑝𝑖 acc 𝑚 = 1 𝑛𝑚 ෍ 𝑖∈𝐵𝑚 𝑦𝑖 ECE = ෍ 𝑚=1 𝑀 𝑛𝑚 𝑁 acc 𝑚 − conf 𝑚 • 予測確率の範囲 [0,1]を 𝑴個のビンに分け, 各ビン 𝒎に含まれる試合集合を 𝑩𝒎 ,その要素数を 𝒏𝒎 とする • conf 𝒎 :ビン内の平均予測勝率 • acc 𝒎 : ビン内の実際の勝率 今回は予測確率の範囲を10個のビンに分けることでECEを算出
  10. 結果 訓練結果① • 2022年から2024年のデータで訓練したグラフ • 横軸がランキングポイントの比の対数, 縦軸が勝率となっている • 黒線が横軸に対する実際の勝率となっている •

    下図は横軸に対する試合数を表している • 上図の黒線において実力差が大きいところでは勝率 が安定していないが,これは対戦数が少ないから
  11. 結果 予測勝率と実際の勝率 • 2025年のデータに対して予測を行ったグラフ • 横軸が予測勝率で縦軸が実際の勝率で階級ごとの値を 示している • 黒の破線は予測勝率と実際の勝率が完全に一致した 場合の直線を表している

    • それぞれのエラーバーは予測勝率と標本数により算出 される95%信頼区間である • Bradley-Terryよりも3-PLMの方が予測勝率と実勝率 が近いものの,信頼区間は真値から外れており, 強いと評価したほうの予測勝率が過小評価であった
  12. 結果 評価結果 • 2025 年の試合予測の性能評価では,両モデルともLogLoss はわずかに改善しているが, ECEはいずれも増加している • 2025年は実力差が大きい対戦が多く組まれていたが,確率の較正(予測確率と実際の勝率の整合性)が やや低下していることを示している

    2022-2024(Train) 2025(Test) LogLoss ECE LogLoss ECE Bradley-Terry 0.6380 0.0220 0.6163 0.0340 3-PLM 0.6353 0.0026 0.6149 0.0192 ECEは依然として0.02未満の範囲に収まっており, 3-PLMは2025年のデータにおいても高い信頼性を保っているといえる しかし…
  13. 総括 • 卓球の世界ランキングポイント比を用いて試合の勝敗予測モデルを作成し,その評価を行った • 勝敗予測モデルはBradley-Terryモデルと3-PLMモデルを用いた • LogLossとECEを用いることで予測性能を評価した • 3-PLMモデルの方がBradley-Terryモデルと比べて両指標において優れた性能を示した •

    テストで用いた2025年のECEの値が上昇していたが,その要因としては大会の開催回数が不 均一であり,ランキングポイントの合計が変化し過去シーズンとは異なる傾向を示した可能性 を指摘した 本研究の現時点の成果 ランキングポイントという単一の情報のみで一定の予測精度と安定性を示した