Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計の基礎12 重回帰

xjorv
February 03, 2021

統計の基礎12 重回帰

統計の基礎12では、1つの従属変数を多数の説明変数で説明する場合の線形回帰の方法である、重回帰について説明します。

xjorv

February 03, 2021
Tweet

More Decks by xjorv

Other Decks in Education

Transcript

  1. 重回帰とは? 2つ以上の説明変数により、従属変数が説明される回帰のこと 血圧 年齢 体重 身長 160 54 88 177

    119 30 61 169 122 41 60 184 143 54 58 174 139 34 85 174 127 46 60 183 119 17 80 177 141 45 72 147 177 62 96 169 110 29 71 166 171 58 92 160 142 68 63 174 146 42 79 170 131 47 57 160 169 56 89 165 139 25 91 180 163 58 81 165 128 48 53 176 154 56 73 173 128 43 55 161 • 血圧が年齢、体重、身長で説明できるか どうか調べる • 血圧が従属変数 • 年齢・体重・身長が説明変数
  2. 重回帰の条件 各説明変数が独立の場合、結果の信頼性が高くなる • 説明変数間の相関が高いと係数の計算が怪しくなる • 傾きが小さい説明変数をたくさん含むと、過学習になる 0 20 40 60

    80 100 120 0 20 40 60 80 0 20 40 60 80 100 120 0 20 40 60 80 直線回帰 変数が6つの多項式回帰 変数が増えると回帰が一般性を失いやすくなる(過学習)
  3. 正規化 データの単位/桁が大きく違う場合には、正規化を行う 正規化: データを平均0、標準偏差1の分布に補正すること 血圧 年齢 体重 身長 0.9723215 0.6259932

    1.049394 0.7569833 -1.170968 -1.173269 -0.865041 -0.133585 -1.014142 -0.348607 -0.935946 1.5362309 0.0836406 0.6259932 -1.077756 0.4230201 -0.125461 -0.873392 0.836679 0.4230201 -0.752765 0.0262392 -0.935946 1.4249098 -1.170968 -2.147869 0.482154 0.7569833 -0.02091 -0.04873 -0.085086 -2.582649 1.8610024 1.2257471 1.616634 -0.133585 -1.641446 -1.248238 -0.155991 -0.467549 1.5473503 0.9258701 1.333014 -1.135475 0.0313652 1.6755626 -0.723231 0.4230201 0.2404666 -0.273638 0.411249 -0.022264 -0.543664 0.1012085 -1.148661 -1.135475 1.4427996 0.7759317 1.120299 -0.57887 -0.125461 -1.548115 1.262109 1.0909465 1.1291475 0.9258701 0.553059 -0.57887 -0.70049 0.1761777 -1.432281 0.6456622 0.6586694 0.7759317 -0.014181 0.311699 -0.70049 -0.198668 -1.290471 -1.024154 平均 5E-10 0 0 1E-09 標準偏差 1 1 1 1 血圧 年齢 体重 身長 160 54 88 177 119 30 61 169 122 41 60 184 143 54 58 174 139 34 85 174 127 46 60 183 119 17 80 177 141 45 72 147 177 62 96 169 110 29 71 166 171 58 92 160 142 68 63 174 146 42 79 170 131 47 57 160 169 56 89 165 139 25 91 180 163 58 81 165 128 48 53 176 154 56 73 173 128 43 55 161 正規化