PRML勉強会第五章 -前半 - 川上雄太作成分

PRML 勉強会第5章ニューラルネットワーク担当：王研究室川上雄太

ニューラルネットワーク(以降NN)はいろんな事に使える最近、第3次NNブームが到来（過ぎつつある？） NNのライブラリ,ツールキットはいろいろあるので、割と手軽に利用可能だったりする

目標それらを使うときのために • 中で何が起こっているのか • パラメータの意味 • etc を理解しておくこと！なので、本質的に重要でなさそうな部分はごっそり
省きます。。。（近似の話、計算の高速化など）

5章のすすめかた(予定) • 第一週 • NNとは何か • NNの訓練 • 誤差逆伝搬 ←重要！
• ヘッセ行列 • 第二週 • NNの正則化、畳み込みNN • 混合密度NN • ベイズNN

NNとは何か PRML §5.1 p.226 – p.233

5.1 フィードフォワードネットワーク関数 • ３,４章でも取り扱ったクラス分類の線形モデルを思い出す , = =1 (5.1) ・
はクラス分類なら非線形活性化関数回帰なら恒等写像 • 基底関数の線形和を関数にかける、という式 • をさらにパラメータ依存の関数にすると？

5.1 フィードフォワードネットワーク関数 = = ℎ (1) + 0 (1) =1
(5.3) ← (5.2) ℎ(・)はシグモイド関数 • ここでいう(1)は、1層目という意味 (後で説明) • これを(5.1)式の線形モデルの基底関数とする

5.1 フィードフォワードネットワーク関数 = ℎ (1) + 0 (1) =1 (5.3)
← (5.2) = (2) + 0 (2) =1 (5.5) ← (5.4) (5.1)式のに相当 (5.1)式のf ・に相当

5.1 フィードフォワードネットワーク関数入力値を2段階の線形和・非線形関数で変換している = ℎ (1) + 0 (1) =1
(5.3) ← (5.2) = (2) + 0 (2) =1 (5.5) ← (5.4) 入力層隠れ層出力層

5.1 フィードフォワードネットワーク関数 • 1つにまとめると • 図で表すと , = 2 =0
ℎ (1) =0 (5.9)

5.1 フィードフォワードネットワーク関数 • こんな図で表せるので”ネットワーク” • (5.9)式の出力を求める計算過程を順伝搬と呼ぶ • 今後この構造を2層NNと呼ぶ • ネットワーク構造には様々な拡張が考えられる

NNのはたらき • 万能近似器 • どんな連続関数でも任意の精度で近似可能 (隠れ層をめっちゃ増やせば)

NNの訓練 PRML §5.2 p.233 – p.242

何をしたいのか • NNのパラメータは2層まとめて • この重みを最適化したい →誤差関数の最小化 , = 2
=0 ℎ (1) =0 5.9 再掲

解くべき問題と誤差関数の種類回帰 2クラス分類他クラス分類出力ユニットの活性化関数線形出力関数 = ロジスティック
シグモイド関数 = 1 1 + exp − ソフトマックス関数 = exp (, ) exp( (, )) 誤差関数二乗和誤差関数 = 1 2 , =1 − 2 交差エントロピー誤差関数 E = − ln =1 + 1 − ln 1 − 多クラス交差エントロピー誤差関数 E = − ln , =1 =1

5.2.1 パラメータ最適化 • 誤差関数の値が小さくなる方向にパラメータを更新していけばいい（勾配降下法など） (+1) = + ∆() •
いろいろなアルゴリズムがあるが、結局は∆()の決め方の違い

5.2.4 勾配降下最適化 • 最も単純なアプローチ (+1) = () − (()) •
は学習率パラメータ • 最急降下法ともいう • バッチ訓練では共役勾配法、準ニュートン法などの方が頑健で速い

5.2.4 勾配降下最適化 • 勾配降下法にはオンライン版もある • オンライン？個々のデータ点について逐次的に最適化データの冗長性に強い局所解を回避しやすい

誤差逆伝搬 error backpropagation PRML §5.3 p.242 – p.250

何をしたいのか • NNは誤差関数を最小化するように学習する（最急降下法の場合） (+1) = () − (()) •
パラメータに関する誤差関数の微分が知りたい

5.3.1 誤差関数微分の評価 • 例えば単純な線形モデルの場合 = =1 (5.45) • ある入力パターンnに対する誤差関数は =
1 2 − 2 (5.46) • 重みに関する勾配は = − (5.47) 誤差信号リンクの入力値

5.3.1 誤差関数微分の評価 • 多層ネットワークの場合は？複数層の線形モデルと非線形関数 = = ℎ • 誤差関数
は、を通してのみに依存することを利用して微分を分解 = (5.50)

5.3.1 誤差関数微分の評価 = 5.50 ここで、 ≡ は誤差と呼ばれるまた、 = (5.52)
すると = (5.53)

5.3.1 誤差関数微分の評価 = 5.53 (5.47)式を参考にすると = − (5.54) • 隠れユニットのは
= = (5.55) という感じで入力側に遡って評価

5.3.1 誤差関数微分の評価 • 長々やったけど結局どういうことかというと逆伝搬公式 = = ℎ′ 出力側入力側

学習の流れ０．重みをランダムに振る１．入力ベクトルによる現在の出力を求める (順伝搬) ２．出力層での誤差を計算する３．をもとに全ての隠れユニットのを得る(逆伝搬)
４．を用いて誤差関数の微分( )を評価５．重みを更新６．誤差が十分小さくなったら終了ならなければ１.に戻る (+1) = () − (())

とりあえずここまで次週は・NNの正則化・NNのなかまたち（畳込みNN, 混合密度NN, ベイズNN）・deep learningの話についてできるといいなああ

PRML勉強会第五章 -前半 - 川上雄太作成分

PRML勉強会第五章 -前半 - 川上雄太作成分

takegue

More Decks by takegue

Other Decks in Technology

Featured

Transcript

PRML 勉強会第5章ニューラルネットワーク担当：王研究室川上雄太

ニューラルネットワーク(以降NN)はいろんな事に使える最近、第3次NNブームが到来（過ぎつつある？） NNのライブラリ,ツールキットはいろいろあるので、割と手軽に利用可能だったりする

目標それらを使うときのために • 中で何が起こっているのか • パラメータの意味 • etc を理解しておくこと！なので、本質的に重要でなさそうな部分はごっそり

5章のすすめかた(予定) • 第一週 • NNとは何か • NNの訓練 • 誤差逆伝搬 ←重要！

NNとは何か PRML §5.1 p.226 – p.233

5.1 フィードフォワードネットワーク関数 • ３,４章でも取り扱ったクラス分類の線形モデルを思い出す , = =1 (5.1) ・

5.1 フィードフォワードネットワーク関数 = = ℎ (1) + 0 (1) =1

5.1 フィードフォワードネットワーク関数 = ℎ (1) + 0 (1) =1 (5.3)

5.1 フィードフォワードネットワーク関数入力値を2段階の線形和・非線形関数で変換している = ℎ (1) + 0 (1) =1

5.1 フィードフォワードネットワーク関数 • 1つにまとめると • 図で表すと , = 2 =0

5.1 フィードフォワードネットワーク関数 • こんな図で表せるので”ネットワーク” • (5.9)式の出力を求める計算過程を順伝搬と呼ぶ • 今後この構造を2層NNと呼ぶ • ネットワーク構造には様々な拡張が考えられる

NNのはたらき • 万能近似器 • どんな連続関数でも任意の精度で近似可能 (隠れ層をめっちゃ増やせば)

NNのはたらき • 万能近似器 • どんな連続関数でも任意の精度で近似可能 (隠れ層をめっちゃ増やせば)

NNの訓練 PRML §5.2 p.233 – p.242

何をしたいのか • NNのパラメータは2層まとめて • この重みを最適化したい →誤差関数の最小化 , = 2

解くべき問題と誤差関数の種類回帰 2クラス分類他クラス分類出力ユニットの活性化関数線形出力関数 = ロジスティック

5.2.1 パラメータ最適化 • 誤差関数の値が小さくなる方向にパラメータを更新していけばいい（勾配降下法など） (+1) = + ∆() •

5.2.4 勾配降下最適化 • 最も単純なアプローチ (+1) = () − (()) •

5.2.4 勾配降下最適化 • 勾配降下法にはオンライン版もある • オンライン？個々のデータ点について逐次的に最適化データの冗長性に強い局所解を回避しやすい

誤差逆伝搬 error backpropagation PRML §5.3 p.242 – p.250

何をしたいのか • NNは誤差関数を最小化するように学習する（最急降下法の場合） (+1) = () − (()) •

5.3.1 誤差関数微分の評価 • 例えば単純な線形モデルの場合 = =1 (5.45) • ある入力パターンnに対する誤差関数は =

5.3.1 誤差関数微分の評価 • 多層ネットワークの場合は？複数層の線形モデルと非線形関数 = = ℎ • 誤差関数

5.3.1 誤差関数微分の評価 = 5.50 ここで、 ≡ は誤差と呼ばれるまた、 = (5.52)

5.3.1 誤差関数微分の評価 = 5.53 (5.47)式を参考にすると = − (5.54) • 隠れユニットのは

5.3.1 誤差関数微分の評価 • 長々やったけど結局どういうことかというと逆伝搬公式 = = ℎ′ 出力側入力側

学習の流れ０．重みをランダムに振る１．入力ベクトルによる現在の出力を求める (順伝搬) ２．出力層での誤差を計算する３．をもとに全ての隠れユニットのを得る(逆伝搬)

とりあえずここまで次週は・NNの正則化・NNのなかまたち（畳込みNN, 混合密度NN, ベイズNN）・deep learningの話についてできるといいなああ

PRML勉強会 第五章 -前半 - 川上雄太作成分

PRML勉強会 第五章 -前半 - 川上雄太作成分

More Decks by takegue

Other Decks in Technology

Featured

Transcript

PRML勉強会第五章 -前半 - 川上雄太作成分

PRML勉強会第五章 -前半 - 川上雄太作成分