バイアスとバリアンスのトレードオフ

,ͷษڧνϟϯωϧ

今回の内容 •回帰モデルを作成した時のモデルの複雑さについて •バイアスとバリアンスとは •バイアスとバリアンスのトレードオフ •まとめバイアスとバリアンス

回帰モデルを作成することを考えます x0からx1を予測したいとします x1 x0 • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • • • • • •

回帰モデルを作成することを考えますデータを訓練データとテストデータに分けます x1 x0 • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • テストデータ訓練データ訓練データで回帰モデルを学習させてテストデータで性能を検証しましょう

回帰モデルを作成することを考えます線形回帰をフィットした場合 x1 x0 • • • • • •
• • • • • • • • • • • • • • • • • •

回帰モデルを作成することを考えます二次関数をフィットした場合 x1 x0 • • • • • •
• • • • • • • • • • • • • • • • • •

回帰モデルを作成することを考えます三次関数をフィットした場合 x1 x0 • • • • • •
• • • • • • • • • • • • • • • • • •

回帰モデルを作成することを考えますかなり複雑なモデルをフィットさせた場合

訓練データに対してどれくらいフィットしているか確認しますモデルが複雑なほど複雑な形状が表現できて、訓練誤差が小さくなるモデル複雑さ訓練誤差大中小大中小
(訓練データに対する Mean Squared Error)

訓練データに対してどれくらいフィットしているか確認しますモデル複雑さと訓練誤差の関係をグラフで見てみますモデル複雑さ訓練誤差大中小大中小
(訓練データに対する Mean Squared Error) Error model complexity • • • • • • • •

テストデータに対してどれくらいフィットしているか確認しますモデルがシンプルすぎても複雑すぎても、テスト誤差が大きくなりますモデル複雑さテスト誤差大小大大中小
(テストデータに対する Mean Squared Error) • • • • • • • • • • • • • • • • • • • • • • • • • • •

テストデータに対してどれくらいフィットしているか確認しますモデル複雑さとテスト誤差の関係をグラフで見てみますモデル複雑さテスト誤差大中小大中小
(テストデータに対する Mean Squared Error) Error model complexity • • • • • • • •

2つのグラフを重ねて見ますモデル複雑さとテスト誤差の関係をグラフで見てみます Error model complexity • • • • •
• • • • • • • • • • • • • テスト誤差とモデル複雑さの関係訓練誤差とモデル複雑さの関係一番欲しいモデルはこのあたりにあるこの誤差はどこから来ている？

テスト誤差が何で構成されているかテスト誤差 = テストデータの分散 + モデルの分散 + バイアスの二乗 E[(y −
̂ y)2] = E[y2 − 2y ̂ y + ̂ y2] = E[y2] − 2E[y ̂ y] + E[ ̂ y2] = {Var[y] + E[y]2} − 2E[y ̂ y] + {Var[ ̂ y] + E[y]2} = Var[y] + Var[ ̂ y] + (E[y] − E[ ̂ y])2 テストデータの分散 + モデルの分散 + バイアスの二乗テストデータにもとから存在する分散であり、モデルではどうにもできない。 irreducible errorと呼ぶ。 (バリアンス) Var[y] = E[y2] − E[y]2 期待値と分散の間に成り立つ式を用いて式を展開しています。

グラフと式を比較してみるバリアンスとバイアスの間にはトレードオフがあることが分かります E[(y − ̂ y)2] = Var[y] + Var[
̂ y] + (E[y] − E[ ̂ y])2 テストデータの分散 + モデルの分散 + バイアスの二乗 (バリアンス) Error model complexity • • • • • • • • • • • • • • • • モデルを複雑にするほど訓練データにフィットできて (E[y] − E[ ̂ y])2 バイアス項は小さくなるはずしかし訓練データに依存して予測値がばらつくためバリアンスは大きくなり、予測誤差は増える

グラフと式を比較してみるバリアンスとバイアスの間にはトレードオフがあることが分かります E[(y − ̂ y)2] = Var[y] + Var[
̂ y] + (E[y] − E[ ̂ y])2 テストデータの分散 + モデルの分散 + バイアスの二乗 (バリアンス) Error model complexity • • • • • • • • • • • • • • • • モデルを簡単にするほど訓練データにフィットしづらくなりバイアスは増えるしかしシンプルなモデルほど予測モデルは訓練データに依存して出力がばらつくことがなくなり、バリアンスは小さくなると考えることができる

まとめバイアスとバリアンスについて説明しました • バイアス =モデルの予測値と真の正解との間のズレ • バリアンス = モデルの予測値のばらつき具合 •
2つの間にはトレードオフがあり、複雑なモデルを使えばバリアンスが高くなり、シンプルなモデルを使うほどバイアスが高くなる • バイアスとバリアンスのトレードオフを理解した上でモデルの選択を行う必要がある ࢀߟจݙɿTrevor Hastie ɾRobert Tibshirani ɾJerome Friedman (2014)ʰ౷ܭతֶशͷجૅʕσʔλϚΠχϯάɾਪ࿦ɾ༧ଌʕʱஶɾਿࢁ কɾҪख ߶ɾਆቇ හ߂ɾ܀ా ଟت ෉ɾલా ӳ࡞, p256

バイアスとバリアンスのトレードオフ

バイアスとバリアンスのトレードオフ

K_DM

More Decks by K_DM

Other Decks in Research

Featured

Transcript

,ͷษڧνϟϯωϧ

今回の内容 •回帰モデルを作成した時のモデルの複雑さについて •バイアスとバリアンスとは •バイアスとバリアンスのトレードオフ •まとめバイアスとバリアンス

回帰モデルを作成することを考えます x0からx1を予測したいとします x1 x0 • • • • • •

回帰モデルを作成することを考えますデータを訓練データとテストデータに分けます x1 x0 • • • • • •

回帰モデルを作成することを考えます線形回帰をフィットした場合 x1 x0 • • • • • •

回帰モデルを作成することを考えます二次関数をフィットした場合 x1 x0 • • • • • •

回帰モデルを作成することを考えます三次関数をフィットした場合 x1 x0 • • • • • •

回帰モデルを作成することを考えますかなり複雑なモデルをフィットさせた場合

訓練データに対してどれくらいフィットしているか確認しますモデルが複雑なほど複雑な形状が表現できて、訓練誤差が小さくなるモデル複雑さ訓練誤差大中小大中小

訓練データに対してどれくらいフィットしているか確認しますモデル複雑さと訓練誤差の関係をグラフで見てみますモデル複雑さ訓練誤差大中小大中小

テストデータに対してどれくらいフィットしているか確認しますモデルがシンプルすぎても複雑すぎても、テスト誤差が大きくなりますモデル複雑さテスト誤差大小大大中小

テストデータに対してどれくらいフィットしているか確認しますモデル複雑さとテスト誤差の関係をグラフで見てみますモデル複雑さテスト誤差大中小大中小

2つのグラフを重ねて見ますモデル複雑さとテスト誤差の関係をグラフで見てみます Error model complexity • • • • •

テスト誤差が何で構成されているかテスト誤差 = テストデータの分散 + モデルの分散 + バイアスの二乗 E[(y −

グラフと式を比較してみるバリアンスとバイアスの間にはトレードオフがあることが分かります E[(y − ̂ y)2] = Var[y] + Var[

グラフと式を比較してみるバリアンスとバイアスの間にはトレードオフがあることが分かります E[(y − ̂ y)2] = Var[y] + Var[

まとめバイアスとバリアンスについて説明しました • バイアス =モデルの予測値と真の正解との間のズレ • バリアンス = モデルの予測値のばらつき具合 •