scikit-learnとTFによる実践機械学習4.1-4.2 / Hands-On Machine Learning with Scikit-Learn and TensorFlow 4.1-4.2

scikit-learnとTensorFlowによる実践機械学習 4.1 – 4.2 解説 @Linus_MK 2018年6月15日

自己紹介ライナス(@Linus_MK) 業務は音声系のソフト開発 C/C++ 機械学習は学校で少しやった+趣味でやっている程度

目次 4.1 線形回帰 4.2 勾配降下法 ※ソースコードはスライドに掲載していませんので、本を参照ください

目次線形回帰の問題を、複数の方法で解く 4.1 最適解を直接計算する 4.2 反復的に計算する（勾配降下法）

線形回帰モデル = 0 + 1 1 + 2 2 +
⋯ + = T ⋅ = ℎ () yの予測値仮説関数

線形回帰モデルを訓練する性能指標として一般的なのは RMSE（二乗平均平方根誤差） RMSEの最小化 ⇔MSE （平均二乗誤差）の最小化 MSE , ℎ =
1 =1 T ⋅ − 2

正規方程式が最小となるθを求めたい実は、このようなθは正規方程式 = T ⋅ −1 ⋅ T ⋅
で求まる。 MSE , ℎ = 1 =1 T ⋅ − 2

計算例 = 4 + 31 + ガウスノイズ（正規分布）

正規方程式の計算量と問題点正規方程式 = T ⋅ −1 ⋅ T ⋅ 問題点
• n（特徴量の数）が大きいと計算時間がかかる • 全てのインスタンスのデータをメモリに乗せる必要 →正規方程式を解けないときは勾配降下法が使える。 n次正方行列

目次 4.1 線形回帰 4.2 勾配降下法

勾配降下法 1. θの初期値をランダムにとる 2. 毎ステップ、コスト関数が小さくなるように θを更新する 3. 収束したら終了

学習率重要なハイパーパラメータ ×学習率が小さい収束に時間がかかりすぎ ×学習率が大きい収束せず発散する

その他の問題点局所解への収束台地スケーリング問題等高線が細長い場合は収束が遅いもっといいアルゴリズムないの? 11章で出てきます

3種類の勾配降下法 4.2.1 バッチ勾配降下法全てのインスタンスに対する学習を一気に行う 4.2.2 確率的勾配降下法一つのインスタンスだけを使って学習する 4.2.3 ミニバッチ勾配降下法上2つの中間。一部の（複数個の）インスタンスだけを
使って学習する

バッチ勾配降下法降下方向（勾配）を求めるために各変数で偏微分 MSE = 1 =1 T ⋅ − 2
MSE = 2 =1 T ⋅ − () 関数の勾配ベクトルは MSE = 2 T ⋅ ( ⋅ − )

バッチ勾配降下法 1. θの初期値をランダムにとる 2. 毎ステップ、コスト関数が小さくなるように θを更新する 3. 収束したら終了 (next) =
− ⋅ MSE 学習率

バッチ勾配降下法と学習率

確率的勾配降下法訓練セットの一つのインスタンスだけを使って学習する ◦非常に高速 ◦アウトオブコア（＝メモリに乗りきらないデータ）に対応・ある点で止まることがない →◦局所解から脱出しやすい →×最適解に留まらない m回（インスタンスの数）を1エポックというただしランダムに選ぶので、複数回選ばれる／
選ばれないインスタンスがある

ミニバッチ勾配降下法訓練セットの一部分のインスタンスだけを使って学習する ◦特にGPU上では、行列演算を高速化できる・確率的勾配降下法と比べると、動きは緩やかなので →×局所解から脱出しにくい →◦最適解に落ち着きやすい

3種類の勾配降下法の比較 https://www.oreilly.com/library/view/hands-on-machine-learning/9781491962282/ch04.html

まとめ：アルゴリズムの比較 ※正規方程式は線形回帰にしか使えないが、勾配降下法はそれ以外の最適化にも使用できる

まとめ線形回帰の問題を、複数の方法で解く 4.1 最適解を直接計算する正規方程式 4.2 反復的に計算する（勾配降下法）バッチ勾配降下法確率的勾配降下法ミニバッチ勾配降下法

scikit-learnとTFによる実践機械学習4.1-4.2 / Hands-On Mach...

scikit-learnとTFによる実践機械学習4.1-4.2 / Hands-On Machine Learning with Scikit-Learn and TensorFlow 4.1-4.2

Linus_MK

More Decks by Linus_MK

Other Decks in Technology

Featured

Transcript

scikit-learnとTensorFlowによる実践機械学習 4.1 – 4.2 解説 @Linus_MK 2018年6月15日

自己紹介ライナス(@Linus_MK) 業務は音声系のソフト開発 C/C++ 機械学習は学校で少しやった+趣味でやっている程度

目次 4.1 線形回帰 4.2 勾配降下法 ※ソースコードはスライドに掲載していませんので、本を参照ください

目次線形回帰の問題を、複数の方法で解く 4.1 最適解を直接計算する 4.2 反復的に計算する（勾配降下法）

線形回帰モデル = 0 + 1 1 + 2 2 +

線形回帰モデルを訓練する性能指標として一般的なのは RMSE（二乗平均平方根誤差） RMSEの最小化 ⇔MSE （平均二乗誤差）の最小化 MSE , ℎ =

正規方程式が最小となるθを求めたい実は、このようなθは正規方程式 = T ⋅ −1 ⋅ T ⋅