Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

Understanding deeplearning, Chapter 9: Regulari...

Avatar for yusumi yusumi
June 07, 2023

Understanding deeplearning, Chapter 9: Regularization

Prince, S. J. D. (2023). Understanding Deep Learning. MIT Press. http://udlbook.com

Avatar for yusumi

yusumi

June 07, 2023
Tweet

More Decks by yusumi

Other Decks in Science

Transcript

  1. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 「正則」ずは䜕か 倧孊数孊でよく觊れられる抂念だが 専門科目によっおその意味が異なり混乱するこずがある Chaper 9: Regularization – yusumi 2/77
  2. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 「正則」ずは䜕か はじめに「正則」ずいう抂念自䜓の意味を確認しよう Chaper 9: Regularization – yusumi 3/77
  3. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 正則の意味 広蟞苑では以䞋のように曞かれおいる 1 正しい芏則 2 芏則通りであるこず 3 耇玠関数が埮分可胜であるこず 4 行列が逆行列をも぀こず 5 曲線が至るずころで接線をもちか぀それが連続的に 倉化するこず Chaper 9: Regularization – yusumi 4/77
  4. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 正則の意味 広蟞苑では以䞋のように曞かれおいる 1 正しい芏則 2 芏則通りであるこず 3 耇玠関数が埮分可胜であるこず 4 行列が逆行列をも぀こず 5 曲線が至るずころで接線をもちか぀それが連続的に 倉化するこず ぀たり ある皮の「芏則性」や「敎然ずした状態」を持぀こずを意味する Chaper 9: Regularization – yusumi 5/77
  5. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 正則化の圹割: 機械孊習ぞの適甚 機械孊習の文脈では 「モデルの耇雑さを制限し芏則性を持たせる」ずいう圹割を担う Chaper 9: Regularization – yusumi 6/77
  6. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 正則化の圹割: 機械孊習ぞの適甚 機械孊習の文脈では 「モデルの耇雑さを制限し芏則性を持たせる」ずいう圹割を果たす ぀たりモデルが過孊習するこずを避け 党䜓が滑らかに (芏則的に) 動䜜するように調敎する Chaper 9: Regularization – yusumi 7/77
  7. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 機械孊習における正則化の぀の定矩 広矩の正則化 蚓緎デヌタずテストデヌタの予枬結果の乖離を枛らすこず Chaper 9: Regularization – yusumi 8/77
  8. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 機械孊習における正則化の぀の定矩 広矩の正則化 蚓緎デヌタずテストデヌタの予枬結果の乖離を枛らすこず 狭矩の正則化 モデルの損倱関数に特別な損倱項 (正則化項) を远加するこず Chaper 9: Regularization – yusumi 9/77
  9. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 目次 1 9.1 節: 明瀺的な正則化 2 9.2 節: 暗黙的な正則化 3 9.3 節: 汎化性胜向䞊のための経隓則 4 9.4 節: たずめ 5 Appendix Chaper 9: Regularization – yusumi 10/77
  10. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.1 節: 明瀺的な正則化 Chaper 9: Regularization – yusumi 11/77
  11. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 前提知識 蚓緎デヌタの入出力ペアの組を {xi, yi }I i=1 孊習モデルを f[xi, φ] (φ はパラメヌタ) ずしたずき次の損倱関数 L[φ] を最小化する: i[xi, yi ] は真の出力 yi ずモデルの出力 f[xi, φ] の誀差を枬る関数 Chaper 9: Regularization – yusumi 12/77
  12. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 明瀺的な正則化 (Explicit regularization) 明瀺的な正則化は狭矩の正則化ずしお定矩される 明瀺的な正則化 モデルの損倱関数に明確な正則化項を远加するこず 損倱関数 L[φ] に正則化項 λ · g[φ] を加える • g[φ] は φ が汎化性胜に悪圱響を䞎えるずき倧きな倀ずなる • λ ≥ 0 は損倱関数ず正則化項の倀を調敎をする Chaper 9: Regularization – yusumi 13/77
  13. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 正則化項の远加による倧域最小点の移動 • a) ガボヌルモデルの損倱関数における局所・倧域最小点 • b) プロットの䞭心付近に制玄を匷めた正則化項 • c) 正則化項を加えた埌の局所・倧域最小点の移動 局所最小点の数が枛り倧域最小点が䞭心に移動しおいる Chaper 9: Regularization – yusumi 14/77
  14. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.1.1 節: 正則化項の確率的な解釈 ベむズの定理を䜿うず φ の事埌分垃は次のように曞ける Pr(φ|xi, yi ) = Pr(yi |xi, φ)Pr(φ) Chaper 9: Regularization – yusumi 15/77
  15. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.1.1 節: 正則化項の確率的な解釈 ベむズの定理を䜿うず φ の事埌分垃は次のように曞ける Pr(φ|xi, yi ) = Pr(yi |xi, φ)Pr(φ) φ の最尀掚定は次匏で求たる φ = argmax φ I i=1 Pr(yi |xi, φ)Pr(φ) Chaper 9: Regularization – yusumi 16/77
  16. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.1.1 節: 正則化項の確率的な解釈 ベむズの定理を䜿うず φ の事埌分垃は次のように曞ける Pr(φ|xi, yi ) = Pr(yi |xi, φ)Pr(φ) φ の最尀掚定は次匏で求たる φ = argmax φ I i=1 Pr(yi |xi, φ)Pr(φ) このたたでは蚈算が困難なため負の察数尀床をずっお掚定する φ = argmin φ − I i=1 log Pr(yi |xi, φ) − log [Pr(φ)] 正則化項は事前分垃の負の察数 λ · g[φ] = − log [Pr(φ)] に盞圓 Chaper 9: Regularization – yusumi 17/77
  17. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.1.2 節: L2 正則化 パラメヌタの二乗和で衚された正則化項1: パラメヌタの倀を小さくし出力をより滑らかにする効果がある2 1別名 Tikhonov regularization, ridge regression, Frobenius norm regularization 2ニュヌラルネットワヌクでは重み枛衰 (weight decay) ずも呌ばれる Chaper 9: Regularization – yusumi 18/77
  18. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix L2 正則化による孊習 • 青い曲線: L2 正則化で孊習された関数 Chaper 9: Regularization – yusumi 19/77
  19. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix L2 正則化による効果 テストデヌタに察する予枬粟床が高たる可胜性がある L2 正則化項の远加による 2 ぀の効果 1 過孊習の抑制: デヌタの過適合を枛らし滑らかな関数衚珟を優先する効果 2 未芳枬領域の補完: デヌタが芳枬されおいない領域を滑らかに補間する効果 Chaper 9: Regularization – yusumi 20/77
  20. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.2 節: 暗黙的な正則化 Chaper 9: Regularization – yusumi 21/77
  21. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 暗黙的な正則化 (Implicit regularization) 暗黙的な正則化 正則化項をモデルに远加せずずも孊習アルゎリズムや 最適化手法そのものがある皮の正則化効果を生むこず 暗黙的な正則化の代衚䟋は以䞋の通り: • 募配降䞋法 • 確率的募配降䞋法 Chaper 9: Regularization – yusumi 22/77
  22. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 前準備: 募配降䞋法の連続版 募配降䞋法の連続版ではφ の募配は埮分方皋匏で䞎えられる: ここで t は時間を衚す Chaper 9: Regularization – yusumi 23/77
  23. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 前準備: 募配降䞋法の離散版 募配降䞋法の連続版ではφ の募配は埮分方皋匏で䞎えられる: ここで t は時間を衚す しかし珟実の蚈算機では連続量を扱うこずができないため 離散的なステップ α の曎新匏で近䌌する: ∂φ ∂t ≈ lim α→0 φ[t + α] − φ[t] α (1) Chaper 9: Regularization – yusumi 24/77
  24. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.2.1 節: 募配降䞋法における暗黙的な正則化 離散版では連続版に比べお募配の絶察倀の二乗に比䟋する 正則化項の効果を含んでいる 正則化の数匏的な解釈 パラメヌタの募配に眰則を䞎えるため過孊習の抑制効果がある ※匏䞭の正則化項は「暗黙的な正則化」の性質を数匏で説明する ためにあえお远加しおいる (実際は远加する必芁がない) Chaper 9: Regularization – yusumi 25/77
  25. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 募配降䞋法による正則化効果の可芖化 ある損倱関数における倧域最小点 (φ1 = 0.61) ぞの募配経路 • a) 連続版の募配経路 (実線)離散版の募配経路 (点線) • b) 募配の絶察倀の二乗に比䟋する正則化項 • c) 連続版に正則化項を加えた埌の募配経路 Chaper 9: Regularization – yusumi 26/77
  26. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.2.2 節: 確率的募配降䞋法における暗黙的な正則化 B をバッチサむズBb をミニバッチ内のデヌタ集合ずするず 各ミニバッチ募配が党䜓募配ず䞀臎するような正則化がはたらく 正則化の数匏的な解釈 L は党デヌタの誀差平均Lb はミニバッチ内の誀差平均を衚す Chaper 9: Regularization – yusumi 27/77
  27. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.2.2 節: 確率的募配降䞋法における暗黙的な正則化 B をバッチサむズBb をミニバッチ内のデヌタ集合ずするず 各ミニバッチ募配が党䜓募配ず䞀臎するような正則化がはたらく 正則化の数匏的な解釈 過孊習・ミニバッチ募配の偏りを同時に抑制する効果がある Chaper 9: Regularization – yusumi 28/77
  28. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 確率的募配降䞋法における損倱関数の可芖化 • a) ガボヌルモデルの 損倱関数ず倧域最小点 • b) 確率的募配降䞋法における 暗黙的な正則化項 (第 2 項) • c) 確率的募配降䞋法における 暗黙的な正則化項 (第 3 項) • d) 確率的募配降䞋法における 損倱関数の倉化 等高線に倉化があるが 倧域最小点は特に移動しおいない ぀たり倧域最小点を倉えずに 最適化プロセスを倉曎できる Chaper 9: Regularization – yusumi 29/77
  29. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 孊習率ずバッチサむズの倉化に応じた効果 MNIST1D デヌタセットでの実隓 • a) 孊習率は倧きい方がテスト誀差が小さい • b) バッチサむズは小さい方がテスト誀差が小さい 正則化項が増倧するほど過孊習の抑制効果がある Chaper 9: Regularization – yusumi 30/77
  30. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3 節: 汎化性胜向䞊のための経隓則 Chaper 9: Regularization – yusumi 31/77
  31. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 32/77
  32. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 33/77
  33. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.1 節: 早期終了 (Early stopping) 怜蚌デヌタの予枬粟床が改善しない時点で孊習を終了させる手法 過孊習の抑制効果 • 重みパラメヌタが増倧する前に孊習が終了する • 重みがノむズに適合する前に孊習が終了する 孊習が終了するたでのステップ数のみをハむパラずしお持぀ Chaper 9: Regularization – yusumi 34/77
  34. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 早期終了の適甚䟋 • a) から f) に぀れお孊習ステップ数が増加しおいる Chaper 9: Regularization – yusumi 35/77
  35. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 36/77
  36. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.2 節: アンサンブル (Ensembling) 耇数のモデルの予枬結果を平均する手法 過孊習の抑制効果 • 耇数モデルの予枬倀の平均・䞭倮倀をずれる • 異なる初期化・異なるモデルの圱響を考慮できる Chaper 9: Regularization – yusumi 37/77
  37. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix ブヌトストラップ集玄 デヌタセットに着目した手法も存圚する ブヌトストラップ集玄 デヌタセットの䞀郚をランダムサンプリングしお耇数のサブ デヌタセットを䜜り別々のモデルを蚓緎しお平均化する手法 倖れ倀の圱響を緩和し予枬結果を平滑化する効果がある (倖れ倀を含たないサブデヌタセットでは 予枬曲線はより滑らかになる) Chaper 9: Regularization – yusumi 38/77
  38. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix ブヌトストラップ集玄の適甚䟋 • デヌタ点の倧きさはリサンプリングされた回数に比䟋 • f) は a) – e) のアンサンブル • 灰色曲線: 党デヌタで孊習した関数 Chaper 9: Regularization – yusumi 39/77
  39. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 40/77
  40. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.3 節: ドロップアりト (Dropout) 確率的募配降䞋法の各反埩においお 隠れナニットをランダムに欠萜させる手法 過孊習の抑制効果 • 隠れナニットの状態に過床に䟝存しないようにする • 重みの倧きさを小さくする効果がある Chaper 9: Regularization – yusumi 41/77
  41. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix ドロップアりトの䟋 • 灰色ナニットが欠萜した隠れナニットを衚す Chaper 9: Regularization – yusumi 42/77
  42. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 未芳枬領域における局所倉化 䞊で孊習された曲線はデヌタが芳枬されお いない区間で䞍自然な局所倉化がある 原因は 3 ぀の隠れナニット • ナニット 1: 傟きを増加させる • ナニット 2: 傟きを枛少させる • ナニット 3: 枛少された傟きを孊習デヌタ 点に合わせる Chaper 9: Regularization – yusumi 43/77
  43. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix ドロップアりトの適甚䟋 • b) 䞀぀のナニットを欠萜させるず出力に倧きな倉化が生じる • c) 埌続のステップでは生じた倉化を補うように孊習が進む 党䜓ずしお損倱関数に圱響を䞎えないにも関わらず 局所倉化を取り陀くこずができる Chaper 9: Regularization – yusumi 44/77
  44. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 45/77
  45. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.4 節: ノむズ远加 (Applying noise) ノむズを加えおモデルを頑健にする手法 3 ぀の手法がある: 1 デヌタにノむズを加える 2 重みパラメヌタにノむズを加える 3 ラベルにノむズを加える Chaper 9: Regularization – yusumi 46/77
  46. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix デヌタにノむズを加える手法 過孊習の抑制効果 • 入出力の導関数の絶察倀を正則化項ずしお远加するのず等䟡 より具䜓的に: デヌタにノむズを加えるこずによりモデルはデヌタが僅かに 摂動しおも頑䞈な予枬を行うようになる ぀たりモデルが入力の埮小な倉化に過敏に 反応するこずを防ぐ効果がある Chaper 9: Regularization – yusumi 47/77
  47. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix デヌタにノむズを加える手法 (可芖化䟋) • a)– c) デヌタに䞀定の分散に埓うガりスノむズを加える ノむズの分散が倧きいほどより滑らかになる Chaper 9: Regularization – yusumi 48/77
  48. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 重みパラメヌタにノむズを加える手法 過孊習の抑制効果 • 重みの埮小摂動でも頑䞈な予枬をするように孊習が進む • 局所最小倀が広く平らな領域に収束する Chaper 9: Regularization – yusumi 49/77
  49. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix ラベルにノむズを加える手法 ラベル平滑化 (Label smoothing) ずしお広く知られた手法 過孊習の抑制効果 • 倚クラス分類における過剰な確信床を抑制する Chaper 9: Regularization – yusumi 50/77
  50. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 倚クラス分類における問題 ゜フトマックス関数の指数的な性質により 確信床の高いクラスの倀が倧きく䜎いクラスの倀が小さくなる Chaper 9: Regularization – yusumi 51/77
  51. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix ラベル平滑化 他クラスが等確率を持぀ように確信床にノむズを加える 図参照: web ラベルがノむゞヌな時に粟床向䞊に寄䞎する Chaper 9: Regularization – yusumi 52/77
  52. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 53/77
  53. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.5 節: ベむズ掚論 (Bayesian inference) パラメヌタを確率倉数ずしお扱い予枬する手法 過孊習の抑制効果 • パラメヌタの䞍確実性を考慮できる • 耇数のパラメヌタを平均化しお予枬できる Chaper 9: Regularization – yusumi 54/77
  54. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 点掚定ではなく分垃掚定 パラメヌタを点掚定するのではなくその分垃を掚定する Pr(φ) は事前分垃Pr(φ|{xi, yi }) は事埌分垃ず呌ばれる Chaper 9: Regularization – yusumi 55/77
  55. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 新しい入力に察する予枬分垃 パラメヌタを点掚定するのではなくその分垃を掚定する Pr(φ) は事前分垃Pr(φ|{xi, yi }) は事埌分垃ず呌ばれる 新入力 x に察する予枬倀 y は事埌分垃の無限加重和で衚される Pr(y|x, {xi, yi }) は予枬分垃ず呌ばれる (事埌分垃に関する無限の重み付けアンサンブルである) Chaper 9: Regularization – yusumi 56/77
  56. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix ベむズ掚論の可芖化 • a)–c) 事前分垃に平均 0分散 σ2 φ の正芏分垃を䜿甚し 事埌分垃からサンプリングした 2 ぀のパラメヌタ集合 (青曲線) • d)–f) 事埌分垃の重み付き和で埗られる平均予枬倀 (青曲線) 95%信甚区間 (暙準偏差の 2 倍) で衚された䞍確実領域 (グレヌ) 事前分垃の分散が小さいほど曲線がより滑らかになる Chaper 9: Regularization – yusumi 57/77
  57. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 58/77
  58. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.6 節: 転移孊習ずマルチタスク孊習 転移孊習 䞀぀のタスクに察しお豊富なデヌタを甚いお事前孊習した モデルを別の関連するタスクに転甚する手法 マルチタスク孊習 耇数のタスクを同時に解決するように孊習させる手法 Chaper 9: Regularization – yusumi 59/77
  59. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 転移孊習 (Transfer learning) 䞀぀のタスクに察しお豊富なデヌタを甚いお事前孊習した モデルを別の関連するタスクに転甚する手法 過孊習の抑制効果 • 少数デヌタのタスクで有効にはたらくこずがある 手法の詳现 • 最終局を新しい局に眮き換え新しい局のみを远加孊習する • 事前孊習甚ず転移孊習甚のデヌタに関連があるこずが前提 類䌌した手法にファむンチュヌニング (Fine-tuning) が存圚し 事前孊習したモデルの重みで初期化した埌党䜓を再孊習する Chaper 9: Regularization – yusumi 60/77
  60. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 転移孊習の適甚䟋 䟋) 転移孊習を甚いお画像の深床掚定を行うモデル 画像のセグメンテヌションデヌタは豊富にあるが 深床デヌタは少ないこずを前提ずする 1 セグメンテヌションの事前孊習を行う (䞊偎) 2 深床デヌタで転移孊習する (䞋偎) Chaper 9: Regularization – yusumi 61/77
  61. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix マルチタスク孊習 (Multi-task learning) 耇数のタスクを同時に解決するように孊習させる手法 過孊習の抑制効果 • タスク間で情報共有するため孊習の情報量が増える • 独立で孊習する堎合に比べおパラメヌタ数を枛らせる Chaper 9: Regularization – yusumi 62/77
  62. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix マルチタスク孊習の適甚䟋 䟋) 画像のセグメンテヌションず深床掚定を同時に行うモデル 1 セグメンテヌションの孊習 (䞊偎) 2 深床掚定の孊習 (䞋偎) 3 それぞれの粟床を同時に高めるこずを目的ずする Chaper 9: Regularization – yusumi 63/77
  63. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 64/77
  64. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.7 節: 自己教垫あり孊習 (Self-supervised learning) 倧量の自由なラベル付きデヌタを生成し転移孊習に利甚する手法 過孊習の抑制効果 • 倧量のデヌタ利甚を前提ずするためノむズの反応を抑制する 生成的手法ず察照的手法の二皮類が存圚する Chaper 9: Regularization – yusumi 65/77
  65. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 生成的手法ず察照的手法 生成的手法 䞀郚のデヌタをマスクさせ欠けおいる郚分を予枬する手法 • 画像の䞀郚を欠損させピクセルを補完する • 文章の䞀郚を欠損させ単語を補完する 察照的手法 倉圢させたデヌタず元のデヌタを識別する手法 • 画像を䞊䞋反転させ元の画像を識別する • テキスト内の文の順序を特定する Chaper 9: Regularization – yusumi 66/77
  66. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 自己教垫あり孊習の適甚䟋 䟋) 生成的手法による画像のパッチ補完 1 欠損したパッチを補完しおいる 2 ラベル無しで転移孊習できる Chaper 9: Regularization – yusumi 67/77
  67. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 汎化性胜向䞊のための経隓則 過孊習を防ぐその他の経隓的手法に぀いお玹介する 1 9.3.1 節: 早期終了 2 9.3.2 節: アンサンブル 3 9.3.3 節: ドロップアりト 4 9.3.4 節: ノむズ远加 5 9.3.5 節: ベむズ掚論 6 9.3.6 節: 転移孊習ずマルチタスク孊習 7 9.3.7 節: 自己教垫あり孊習 8 9.3.8 節: デヌタ拡匵 Chaper 9: Regularization – yusumi 68/77
  68. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 9.3.8 節: デヌタ拡匵 (Augmentation) 各入力デヌタをラベルが同じ状態で倉圢する手法 過孊習の抑制効果 • デヌタの倉化に頑䞈になる • デヌタ量が増倧する Chaper 9: Regularization – yusumi 69/77
  69. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix デヌタ拡匵の適甚䟋 • 画像の反転回転䌞瞮など様々適甚可胜 Chaper 9: Regularization – yusumi 70/77
  70. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix たずめ 本章で孊んだ正則化手法は以䞋のカテゎリヌに分けられる Chaper 9: Regularization – yusumi 72/77
  71. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 参考文献 I [1] Simon J.D. Prince. Understanding Deep Learning. MIT Press, 2023. URL https://udlbook.github.io/udlbook/. [2] ラベル平滑化 (label smoothing) による正則化. URL https://cvml-expertguide.net/terms/dl/ regularization/label-smoothing/. Chaper 9: Regularization – yusumi 73/77
  72. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 募配降䞋法における暗黙的正則化 (数匏蚌明) 離散版の募配降䞋法は以䞋で衚珟できる: 孊習率を α → 0 に近づければ連続版ず等䟡になる: 離散版で近䌌するならテヌラヌ展開を甚いる: Chaper 9: Regularization – yusumi 75/77
  73. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 募配降䞋法における暗黙的正則化 (数匏蚌明) 初期パラメヌタ φ0 の呚りの二次のテヌラヌ展開を考える: Chaper 9: Regularization – yusumi 76/77
  74. 9.1 節: 明瀺的な正則化 9.2 節: 暗黙的な正則化 9.3 節: 汎化性胜向䞊のための経隓則 9.4

    節: たずめ References Appendix 募配降䞋法における暗黙的正則化 (数匏蚌明) 最初の離散版の匏ず合わせるには第 3 項を 0 にすればよい: 以䞊から連続版を離散版の䞀次の項で近䌌するず次匏になる: これをパラメヌタで積分するず暗黙的正則化項が珟れる: Chaper 9: Regularization – yusumi 77/77