ハイパーパラメータチューニングって何をしているの

by toridori

Slide 1

Slide 1 text

ハイパーパラメータチューニングって何をしているの開発部　井上 2024/10/25

Slide 2

Slide 2 text

ハイパーパラメータとは

Slide 3

Slide 3 text

（普通の）パラメータ線形回帰での例観測データが与えられたとき、直線（モデル）が最もフィットするような、適切な値を求めたい。このような、データに合わせてモデルの振る舞いを決める値を、モデルのパラメータや重みという。適切なパラメータを求めることを、学習という。

Slide 4

Slide 4 text

「適切な」パラメータの定式化線形回帰での例どのようなときに「最もフィット」するか？線形回帰の例では、次の誤差関数を最小化すればよい（いわゆる最小二乗法）。

Slide 5

Slide 5 text

ハイパーパラメータ Ridge回帰の例モデルの複雑さを抑えるため（上記の例では、パラメータの絶対値が大きくなりにくくするため）、線形回帰の誤差関数に対して、次のような罰則項を加えた関数（コスト関数）を考え、この最小化を考えることがある（Ridge回帰）。ここでλは、罰則の強さを決める正の実数で、値が大きいほど罰則が強くなる（パラメータは絶対値の大きな値を取りにくくなる）。このλは、学習前に事前に決めておくパラメータで、ハイパーパラメータと呼ばれる。

Slide 6

Slide 6 text

フィットさせたい関数パラメータ最小化したい関数ハイパーパラメータここまでのまとめ Ridge回帰の例

Slide 7

Slide 7 text

実際の例ハイパーパラメータを変えて学習した例から生成した点+外れ値に 3つのモデルをフィッティング。 λを大きくすると、傾きも小さくなっている。 ※αはscikit-learnライブラリで設定する際のハイパーパラメータの名前で、 λと同じものと考えて大丈夫です ※Ridge回帰は多重共線性への対処に用いられるのですが、今回は1変数のため説明を割愛

Slide 8

Slide 8 text

ハイパーパラメータチューニング

Slide 9

Slide 9 text

ハイパーパラメータチューニングとはハイパーパラメータに適切な値はあるの？　どうやって決めたらいいの？それを決めるのがハイパーパラメータチューニングです。ハイパーパラメータチューニングとは

Slide 10

Slide 10 text

ハイパーパラメータチューニングの定式化任意のλに対し、コスト関数を最小化するようなをと書くことにする。このとき、誤差関数の値が最も小さくなるようなλを選択すればよい。 ※本当は評価用のデータセットを分けたりしないといけないのですが、今回は割愛 Ridge回帰の例

Slide 11

Slide 11 text

ハイパーパラメータチューニングの方法そのようなハイパーパラメータをどうやって探索すればよいか？あらかじめ決めておいた有限個のリストを探索したり、与えられた範囲からランダムに探索したりする方法もある。完全なランダムではなく、いい感じに確率的に探索してくれるのが、ベイズ最適化。探索の方法

Slide 12

Slide 12 text

最適化とは一般に、関数が最小値（あるいは最大値）を取るような値を求めることを最適化という。ベイズ最適化はブラックボックス最適化の一種で、よく分からない関数でもいい感じに最適化してくれる。ベイズ最適化を行ってくれるPythonのライブラリとしては、Optunaが有名。ベイズ最適化

Slide 13

Slide 13 text

コード例このあたりはMLのテンプレなので Optunaのコード例 Optunaで最適化するために追加するのはこのあたり

Slide 14

Slide 14 text

おまけ

Slide 15

Slide 15 text

最適化の応用例 Googleの研究者がチョコチップクッキーのレシピの最適化をしたらしいです： Bayesian Optimization for a Better Dessert レシピ→“美味しさの評価値”という関数の最大化を試みたわけですね。 Googleのチョコチップクッキーレシピ

Slide 16

Slide 16 text

ご清聴ありがとうございましたおわり