決定係数 r2 と相関係数 r

決定係数 r2 と相関係数 r

決定係数 r2 と相関係数 r
決定係数 r2 と相関係数 r
決定係数 r2
相関係数 r
変数の標準化(オートスケーリング)
回帰式
決定係数 r2 の変形
相関係数 r の二乗の変形
(r)2 − r2
標準回帰係数 b
(r)2 − r2

4ae391ce9562c565ea7a060e5dda5609?s=128

Hiromasa Kaneko

September 06, 2020
Tweet

Transcript

  1. 0 決定係数 r2 と相関係数 r 明治大学 理⼯学部 応用化学科 データ化学⼯学研究室 ⾦⼦

    弘昌
  2. 決定係数 r2 と相関係数 r 決定係数 r2 と、実測値と予測値との間の相関係数 r を 二乗したもの

    (r)2 の関係は、一般的に r2 ≠ (r)2 最小二乗法による線形回帰分析におけるトレーニングデータでは、 r2 = (r)2 ここでは単回帰を例にして r2 = (r)2 を示します 1
  3. 決定係数 r2 2 ( ) ( ) 2 ( )

    ( ) C 2 1 2 ( ) A 1 1 n i i i n i i y y r y y = = − = − −    y(i)︓i 番目のサンプルにおける 目的変数の値 yC (i)︓i 番目のサンプルにおける 目的変数の予測値 yA ︓目的変数の平均値 n︓サンプル数
  4. 相関係数 r 3 ( )( ) ( ) ( )

    ( ) ( ) A C C,A 1 2 2 ( ) ( ) A C C,A 1 1 n i i i n n i i i i y y y y r y y y y = = = − − = − −    y C,A ︓目的変数の 予測値の平均値 ( ) ( )( ) ( ) ( ) 2 ( ) ( ) A C C,A 2 1 2 2 ( ) ( ) A C C,A 1 1 n i i i n n i i i i y y y y r y y y y = = =   − −     = − −   
  5. 変数の標準化(オートスケーリング) 4 x(i)︓i 番目のサンプルにおける説明変数の値 xA ︓説明変数の平均値 問題を簡単にするため、y, x に対して変数の標準化 (オートスケーリング)

    が ⾏われていると仮定 (平均値 は 0、標準偏差(分散) は 1) yA = 0 xA = 0 ( ) ( ) 2 2 ( ) ( ) A 1 1 n n i i i i y y y n = = − = =   ( ) ( ) 2 2 ( ) ( ) A 1 1 n n i i i i x x x n = = − = =   よって、 (分散 1 より)
  6. 回帰式 5 yC (i) = b x(i) b︓標準回帰係数 (x, y

    は標準化されているため、定数項は 0)
  7. 決定係数 r2 の変形 6 ( ) ( ) ( )

    ( ) ( ) 2 2 ( ) ( ) ( ) ( ) C 2 1 1 2 ( ) A 1 2 2 ( ) ( ) ( ) 2 ( ) 1 1 1 ( ) ( ) 2 1 ( ) ( ) 2 1 1 1 2 1 2 1 2 n n i i i i i i n i i n n n i i i i i i i n i i i n i i i y y y bx r n y y y b y x b x n n b y x b n n b y x b n n = = = = = = = = − − = − = − − − + = − − + = − − =         
  8. 相関係数 r の二乗の変形 7 ( ) ( )( ) (

    ) ( ) ( )( ) ( ) ( ) 2 2 ( ) ( ) ( ) ( ) A C C,A A 2 1 1 2 2 2 ( ) ( ) ( ) A C C,A A 1 1 1 2 2 ( ) ( ) 1 2 2 ( ) A 1 2 ( ) ( ) 1 2 n n i i i i i i n n n i i i i i i n i i i n i i n i i i y y y y y bx bx r y y y y n bx bx b y x nb x x y x n = = = = = = = =     − − −         = = − − −       = −       =        
  9. (r)2 − r2 8 ( ) 2 ( ) (

    ) ( ) ( ) 2 2 1 2 1 2 2 ( ) ( ) ( ) ( ) 2 2 2 1 1 2 1 2 n n i i i i i i n n i i i i i i y x b y x b n r r n n y x bn y x b n n = = = =   −     − = −     = − +              
  10. 標準回帰係数 b 9 ( ) ( ) 1 n i

    i i y x b n = =  x, y が標準化されているとき (平均値 0, 分散 1)、 標準回帰係数 b は以下のように計算される
  11. (r)2 − r2 10 ( ) 2 2 2 (

    ) ( ) ( ) ( ) 2 2 2 1 1 2 ( ) ( ) ( ) ( ) 2 ( ) ( ) ( ) ( ) 2 1 1 2 1 1 2 ( ) ( ) ( ) ( ) 2 1 1 1 2 1 2 1 2 n n i i i i i i n n i i i i n n i i i i i i i i n n i i i i i i r r y x bn y x b n n y x y x y x n y x n n n n y x y x n = = = = = = = =     − = − +                         = − +                       = −               2 2 ( ) ( ) 1 0 n i i i y x =     +             =  よって、 r2 = (r)2