Slide 33
Slide 33 text
33
7.3.2 Learning rate schedule
• 確率的勾配降下法 式 (7.18)では、𝜂 の値を指定する必要がある。
➢ 𝜂 が非常に小さい場合、学習が遅くなる。
➢ 𝜂 を大きくしすぎると、学習が不安定になる可能性がある。
➢学習の開始時に 𝜂 の値を大きくし、時間の経過とともに学習率を減らしていくことで、
効率よく学習が進む。
• 学習率のスケジューラとしては、線形、べき乗則、指数関数的減衰などが挙げられる。
➢(7.36)では、𝜂 の値はKステップにわたって線形に減少し、その後は 𝜂 𝐾 で一定にする。
➢ 𝜂 0 , 𝜂(𝐾), 𝐾, 𝑆, 𝑐 の値は経験的に探索する必要がある。
✓実際には、学習中の誤差関数の変化を監視し、適切な速度で減少していることを確
認することが役立つ。