… , 𝑇) を任意に決定 プレイヤー:𝑓1 , … , 𝑓𝑡 を観測し 𝑥𝑡+1 を右手順で計算 (𝐾 ⊆ ℝ𝑛 は ℓ2-直径 𝐷 の凸集合) 1: Fix 𝑥1 ∈ 𝐾 2: For 𝑡 = 1, … , 𝑇 3: Observe 𝑓𝑡 4: Compute 𝑧𝑡 ∈ 𝜕𝑓𝑡 𝑥𝑡 5: 𝑥𝑡+1 ← Proj𝐾 (𝑥𝑡 − 𝜂𝑧𝑡 ) Cutkosky. Anytime online-to-batch, optimism and acceleration. ICML, 2019 Cesa-Bianchi et al. On the generalization ability of on-line learning algorithms. IEEE Trans. Inf. Theory, 2004. Zinkevich ’03 Zinkevich. Online convex programming and generalized infinitesimal gradient ascent. ICML, 2003. リグレット上界 max 𝑡 𝑧𝑡 2 ≤ 𝐿 ならば,𝜂 = 𝐷/(𝐿 𝑇) とすると σ𝑡=1 𝑇 𝑓𝑡 𝑥𝑡 ≤ min 𝑥∗∈𝐾 σ𝑡=1 𝑇 𝑓𝑡 𝑥∗ + 𝑂(𝐷𝐿 𝑇) Online-to-Batch (Cesa-Bianchi et al. ’04, Cutkosky ’19) 𝑓𝑡 が i.i.d., max 𝑡 𝑧𝑡 1 ≤ 𝐿1 , 𝐾 の ℓ∞ -直径が 𝐷∞ なら,確率 1 − 𝛿 で 𝔼 𝑓 1 𝑇 σ𝑡 𝑥𝑡 ≤ min 𝑥∗∈𝐾 𝔼 𝑓(𝑥∗) + 𝑂 𝐷𝐿 𝑛+𝐷∞𝐿1 log(1/𝛿) 𝑇 オンライン劣勾配降下法(OSD)