AAAI 2021で発表したハイパーパラメータ最適化の転移学習⼿法
Warm Starting CMA-ESを解説
M. Nomura*, S. Watanabe*, Y. Akimoto, Y. Ozaki, M. Onishi. “Warm Starting CMA-ES for Hyperparameter Optimization”, AAAI. 2021.
1. ハイパーパラメータ最適化
2. CMA-ES
3. Warm Starting CMA-ES
4. Optunaからの利⽤⽅法
Slide 4
Slide 4 text
ハイパーパラメータ最適化
Slide 5
Slide 5 text
ϋΠύʔύϥϝʔλ࠷దԽ )10
• MLモデルの性能を引き出すために必須の技術
• 深層学習の例:
• ユニット数,レイヤー数,正則化係数,dropout,最適化⼿法の種類,学習率
• 近年研究コミュニティでもハイパーパラメータの重要性が再認識
• Are GANs Created Equal? A Large-Scale Study (NeurIPS’18)
• 多数のGANについての実験
• アルゴリズムの改善よりチューニングによる改善の⽅が⼤きかった
• Are We Really Making Much Progress? A Worrying Analysis of Recent Neural
Recommendation Approaches (RecSys’19 Best Paper)
• チューニングしたk近傍法の性能が多数の深層学習ベースの推薦⼿法を上回った
Slide 6
Slide 6 text
ϋΠύʔύϥϝʔλ࠷దԽ )10
• HPOの流れ:
ML Model
Slide 7
Slide 7 text
ϋΠύʔύϥϝʔλ࠷దԽ )10
• HPOの流れ:
ML Model
ハイパーパラメータ
lr = 0.01
Slide 8
Slide 8 text
ϋΠύʔύϥϝʔλ࠷దԽ )10
• HPOの流れ:
ML Model
ハイパーパラメータ
訓練データに対して学習
lr = 0.01
Slide 9
Slide 9 text
ϋΠύʔύϥϝʔλ࠷దԽ )10
• HPOの流れ:
ML Model
ハイパーパラメータ
訓練データに対して学習
検証誤差を計算
lr = 0.01 val_err = 0.2
Slide 10
Slide 10 text
ϋΠύʔύϥϝʔλ࠷దԽ )10
• HPOの流れ:
• ブラックボックス最適化問題として解釈が可能
ML Model
𝒙 𝒇(𝒙)
Slide 11
Slide 11 text
CMA-ES
Slide 12
Slide 12 text
$."&4
• ブラックボックス最適化で有⼒な⼿法の1つ
• 多変量正規分布 (MGD) を最適化に使⽤
1. MGDから解をサンプル
2. 解を評価し,重み付けを⾏う
3. MGDのパラメータを更新する
4. 1.〜3.を繰り返す
Normal
Distribution
Optimal
Solution