simpleregressionandleastsquares

最小二乗法を用いた単回帰分析 Simple Regression Analysis and Least Squares Method 大阪府立大学工学研究科
清水悠生

2 回帰分析とは？ ✓ あるデータ群から，入力データ(x)と目標データ(y)の関係をモデル化（数式化）し両者の関係を定量的に分析することを回帰分析という ✓ モデル化した曲線（直線）のことを回帰曲線（直線）という x y
x y 回帰直線 y=ax+b 生データたち

3 どのように回帰直線を引くか？ ✓ 回帰直線は各データをよく表すように引きたい… ⇒各データと回帰直線の誤差（残差）が最小となるように回帰直線の係数a, bを決定する ✓ 機械学習の人は誤差，統計の人は残差と呼んでる印象 x
y i番目のデータ(x(i),y(i)) x(i) y(i) ax(i)+b 回帰直線 y=ax+b 誤差 (残差)

4 最小二乗法で扱う誤差関数 ✓ 誤差関数を誤差の2乗の和とし，誤差関数が最小となるような係数a, bを計算する方法が最小二乗法最小二乗法で扱う誤差関数E(a,b) , = ෍
=1 1 2 () − () + 2 aとbの 2変数関数誤差の2乗 x y i番目のデータ(x(i),y(i)) x(i) y(i) ax(i)+b 回帰直線 y=ax+b 誤差 (残差) 各データの2乗誤差を全データ(n個)足し合わせたもの

5 誤差関数は下に凸の2次関数 ✓ 誤差関数をa,bそれぞれに着目して展開するとそれぞれ下に凸の2次関数であることがわかる ✓ 偏微分により簡単に最小値を求めることが可能 , = ෍
=1 1 2 () − () + 2 = ෍ =1 1 2 () 2 − 2() () − + () − 2 ෍ =1 1 2 2 + 2 () − () + () − () 2 E a E b a,bどちらに着目しても誤差関数はa,bに関して下に凸の2次関数（狭義の凸関数と呼ばれる）最小となる1点が存在

6 誤差関数を最小化する(1/2) ✓ 誤差関数をa,bそれぞれ偏微分して0とし連立方程式を解くことで，誤差関数を最小とする解a*,b*を求める , = ෍ =1 1
2 () − () + 2 ∗, ∗ = − ෍ =1 () − ∗() − ∗ () = 0 ∗, ∗ = − ෍ =1 () − ∗() − ∗ = 0 ⟺ ∗ ෍ =1 () 2 + ∗ ෍ =1 () = ෍ =1 ()() ∗ ෍ =1 () + ∗ = ෍ =1 () 合成関数の微分

7 誤差関数を最小化する(2/2) この関係式を前頁1段目の式に代入する ∗ ෍ =1 () 2 + ∗
෍ =1 () = ෍ =1 ()() ⟺ ∗ ෍ =1 () 2 + −∗ + ෍ =1 () = ෍ =1 ()() ⇔ ∗ = σ ()() − σ () σ () 2 − σ () = − ∙ 2 − 2 = (との共分散) (の分散) ∗ ෍ =1 () + ∗ = ෍ =1 () ⟺ ∗ = −∗ σ () + σ () = −∗ + n個のx i ,y i の平均 ✓ このように回帰直線の係数a*,b*が求められる

8 行列で記述するほうがすっきり ✓ 行列で記述するほうが簡単にかける = ෍ =1 1 2 ()
− () + 2 = 1 2 (1) − (1) + 2 + ⋯ + () − () + 2 = 1 2 − T − (1) = (1) + (2) = (2) + () = () + … (1) (2) ⋮ () = (1) (2) ⋮ () + = (1) (2) ⋮ () 1 1 ⋮ 1 ⟺ = このように行列を定義すると，誤差関数は下記のとおり

9 行列表現での最小化 ✓ 誤差関数を係数ベクトルwで微分して0とする = 1 2 − T −
∗ = 0 ⟺ 1 2 ∙ 2 −T − ∗ = ⟺ T − T∗ = ⟺ T∗ = T ⟺ ∗ = T −1 T ✓ ベクトルの微分がわからない方は「ベクトル微分」で検索してください（いろいろ公式がでてきます） ✓ ここらへんの式変形は成分表示してがんばって計算したら大体理解できますベクトルの微分公式より展開移行両辺に逆行列を左からかける（Tが逆行列を持つと仮定）

10 なぜ誤差を二乗したのか？ , = ෍ =1 () − () +
✓ 各データの誤差は正/負両方存在するためそのまま足し合わせると誤差が相殺されてしまう ✓ 誤差を2乗すれば非負となり，和で評価が可能になる ✓ 誤差の絶対値をとると最小値を求めるのが難しくなるため 2乗する方法を採用これだと解析的に最小値を求めるのが難しい！

simpleregressionandleastsquares

simpleregressionandleastsquares

yuki

More Decks by yuki

Featured

Transcript

最小二乗法を用いた単回帰分析 Simple Regression Analysis and Least Squares Method 大阪府立大学工学研究科

2 回帰分析とは？ ✓ あるデータ群から，入力データ(x)と目標データ(y)の関係をモデル化（数式化）し両者の関係を定量的に分析することを回帰分析という ✓ モデル化した曲線（直線）のことを回帰曲線（直線）という x y

4 最小二乗法で扱う誤差関数 ✓ 誤差関数を誤差の2乗の和とし，誤差関数が最小となるような係数a, bを計算する方法が最小二乗法最小二乗法で扱う誤差関数E(a,b) , = ෍

5 誤差関数は下に凸の2次関数 ✓ 誤差関数をa,bそれぞれに着目して展開するとそれぞれ下に凸の2次関数であることがわかる ✓ 偏微分により簡単に最小値を求めることが可能 , = ෍

6 誤差関数を最小化する(1/2) ✓ 誤差関数をa,bそれぞれ偏微分して0とし連立方程式を解くことで，誤差関数を最小とする解a,bを求める , = ෍ =1 1

7 誤差関数を最小化する(2/2) この関係式を前頁1段目の式に代入する ∗ ෍ =1 () 2 + ∗

8 行列で記述するほうがすっきり ✓ 行列で記述するほうが簡単にかける = ෍ =1 1 2 ()

9 行列表現での最小化 ✓ 誤差関数を係数ベクトルwで微分して0とする = 1 2 − T −

10 なぜ誤差を二乗したのか？ , = ෍ =1 () − () +