Slide 27
Slide 27 text
CompML
近似誤差の⼀般化保証
近似誤差に以下の上界を与える.
26
𝔼𝒟
ℒ(𝑎, 𝑏) ≤ 𝔼>
!
ℒ 𝑎, 𝑏 +
𝐶?2
𝑏 )
2 𝜆
1
256
+
8 + 𝜈(𝐶, 𝐷, 𝛿)
2𝑛
𝑤ℎ𝑒𝑟𝑒 ℒ 𝑎, 𝑏 ≜ 𝑎#𝑏 − 𝛼𝑓 𝑔 𝑎 , ℎ 𝑏 − 𝛽 , 𝛼 𝑖𝑠 𝑡ℎ𝑒 𝑠𝑐𝑎𝑙𝑒 𝑢𝑠𝑒𝑑
𝑓𝑜𝑟 𝑞𝑢𝑎𝑛𝑡𝑖𝑧𝑖𝑛𝑔 𝑡ℎ𝑒 𝑙𝑜𝑜𝑘𝑢𝑝 𝑡𝑎𝑏𝑙𝑒𝑠, 𝛽 𝑖𝑠 𝑡ℎ𝑒 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑠 𝑢𝑠𝑒𝑑 𝑖𝑛 𝑞𝑢𝑎𝑛𝑡𝑖𝑧𝑖𝑛𝑔
𝑡ℎ𝑒 𝑙𝑜𝑜𝑘𝑢𝑝 𝑡𝑎𝑏𝑙𝑒𝑠 𝑝𝑙𝑢𝑠 𝑡ℎ𝑒 𝑑𝑒𝑏𝑖𝑎𝑠𝑖𝑛𝑔 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡 𝑓𝑜𝑟 𝑓𝑎𝑠𝑡 8𝑏𝑖𝑡 𝑎𝑔𝑔𝑟𝑒𝑔𝑎𝑡𝑖𝑜𝑛, 𝑎𝑛𝑑
𝜈 𝐶, 𝐷, 𝛿 ≜ 𝐶 4 log)
𝐷 + 256 log 2 − log 𝛿
𝐷: ℝ#に対する確率分布
1
𝐴 ∈ ℝ!×#: 各⾏がDから独⽴に得られた学習⾏列. 𝜎9
で最⼤特異値がバウンドされている.
𝐶: 部分空間の数
𝜆: 正則化パラメータ
𝛿: 0 < 𝛿 < 1の値