Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Lean4による汎化誤差評価の形式化

 Lean4による汎化誤差評価の形式化

このスライドはProof Summit2025に向けて作られました. Lean4での機械学習の理論の形式化の取り組みについて紹介しています.

ソースコード
https://github.com/auto-res/lean-rademacher

Lean Formalization of Generalization Error Bound
by Rademacher Complexity
https://arxiv.org/pdf/2503.19605

Avatar for Kei Tsukamoto

Kei Tsukamoto

June 22, 2025
Tweet

Other Decks in Science

Transcript

  1. Lean4による 汎化誤差評価の形式化 笠浦 一海(OSX), 水野 勇磨(University College Dublin), 塚本 慧(東京大学),

    恩田 直登(OSX), 園田 翔(理化学研究所) https://github.com/auto-res/lean-rademacher https://arxiv.org/pdf/2503.19605
  2. Hoeffdingの補題 • 確率変数𝑋が𝔼 𝑋 = 0を満たし, 確率1で𝑎 ≤ 𝑋 ≤

    𝑏であるとき 𝔼[𝑒𝑡𝑋] ≤ 𝑒𝑡2(𝑏−𝑎)2/8
  3. McDiarmidの不等式 • {𝑋𝑖 }𝑖=1 𝑚 を独立な確率変数として、 確率変数𝑓(𝑋1 , … 𝑋𝑚

    )を考える 。ここで𝑓のi番目の引数を変えたとしても高々c𝑖 しか変化しな いとする. • σ𝑖 𝑐𝑖 2 ≤ 1 𝑡 ならばP 𝑓 − 𝔼 𝑓 ≥ 𝜖 ≤ 𝑒−2∗𝜖2∗𝑡
  4. 確率変数列{𝑋𝑖 }𝑖=1 𝑛 について ケース1: i.i.d.(独立同分布)を仮定する場合 確率空間はΩ𝑛(直積測度) 確率変数はX𝑖 : Ω𝑛

    → ℝ (i番目の射影𝜋𝑖 : Ω𝑛 → Ω とX: Ω → ℝ の合成と 解釈したい) 独立性は定義から自動的に成り立つ ケース2: 独立だが必ずしも同分布でない場合 確率空間は Ω 確率変数は X𝑖 : Fin 𝑛 → Ω → ℝ 独立性を仮定する必要がある ケース1でケース2の意味での独立性が 成り立つかを証明する必要があった McDiarmidの不等式の仮定 ラデマッハ変数
  5. • 参考にした資料のマルチンゲール差分列の定義 結局V𝑖 は確率変数? それとも関数? 実はDoob-Dynkinの補題 から同値であることが言える (条件付き期待値の基礎付け) 今回は V𝑖

    を関数として定義して直接McDiarmidの不等式を証明した それによりマルチンゲールやAzuma-Hoeffdingの補題の証明はしなかった