Slide 1

Slide 1 text

0 決定係数 r2 と相関係数 r 明治大学 理⼯学部 応用化学科 データ化学⼯学研究室 ⾦⼦ 弘昌

Slide 2

Slide 2 text

決定係数 r2 と相関係数 r 決定係数 r2 と、実測値と予測値との間の相関係数 r を 二乗したもの (r)2 の関係は、一般的に r2 ≠ (r)2 最小二乗法による線形回帰分析におけるトレーニングデータでは、 r2 = (r)2 ここでは単回帰を例にして r2 = (r)2 を示します 1

Slide 3

Slide 3 text

決定係数 r2 2 ( ) ( ) 2 ( ) ( ) C 2 1 2 ( ) A 1 1 n i i i n i i y y r y y = = − = − −   y(i)︓i 番目のサンプルにおける 目的変数の値 yC (i)︓i 番目のサンプルにおける 目的変数の予測値 yA ︓目的変数の平均値 n︓サンプル数

Slide 4

Slide 4 text

相関係数 r 3 ( )( ) ( ) ( ) ( ) ( ) A C C,A 1 2 2 ( ) ( ) A C C,A 1 1 n i i i n n i i i i y y y y r y y y y = = = − − = − −    y C,A ︓目的変数の 予測値の平均値 ( ) ( )( ) ( ) ( ) 2 ( ) ( ) A C C,A 2 1 2 2 ( ) ( ) A C C,A 1 1 n i i i n n i i i i y y y y r y y y y = = =   − −     = − −   

Slide 5

Slide 5 text

変数の標準化(オートスケーリング) 4 x(i)︓i 番目のサンプルにおける説明変数の値 xA ︓説明変数の平均値 問題を簡単にするため、y, x に対して変数の標準化 (オートスケーリング) が ⾏われていると仮定 (平均値 は 0、標準偏差(分散) は 1) yA = 0 xA = 0 ( ) ( ) 2 2 ( ) ( ) A 1 1 n n i i i i y y y n = = − = =   ( ) ( ) 2 2 ( ) ( ) A 1 1 n n i i i i x x x n = = − = =   よって、 (分散 1 より)

Slide 6

Slide 6 text

回帰式 5 yC (i) = b x(i) b︓標準回帰係数 (x, y は標準化されているため、定数項は 0)

Slide 7

Slide 7 text

決定係数 r2 の変形 6 ( ) ( ) ( ) ( ) ( ) 2 2 ( ) ( ) ( ) ( ) C 2 1 1 2 ( ) A 1 2 2 ( ) ( ) ( ) 2 ( ) 1 1 1 ( ) ( ) 2 1 ( ) ( ) 2 1 1 1 2 1 2 1 2 n n i i i i i i n i i n n n i i i i i i i n i i i n i i i y y y bx r n y y y b y x b x n n b y x b n n b y x b n n = = = = = = = = − − = − = − − − + = − − + = − − =        

Slide 8

Slide 8 text

相関係数 r の二乗の変形 7 ( ) ( )( ) ( ) ( ) ( )( ) ( ) ( ) 2 2 ( ) ( ) ( ) ( ) A C C,A A 2 1 1 2 2 2 ( ) ( ) ( ) A C C,A A 1 1 1 2 2 ( ) ( ) 1 2 2 ( ) A 1 2 ( ) ( ) 1 2 n n i i i i i i n n n i i i i i i n i i i n i i n i i i y y y y y bx bx r y y y y n bx bx b y x nb x x y x n = = = = = = = =     − − −         = = − − −       = −       =        

Slide 9

Slide 9 text

(r)2 − r2 8 ( ) 2 ( ) ( ) ( ) ( ) 2 2 1 2 1 2 2 ( ) ( ) ( ) ( ) 2 2 2 1 1 2 1 2 n n i i i i i i n n i i i i i i y x b y x b n r r n n y x bn y x b n n = = = =   −     − = −     = − +              

Slide 10

Slide 10 text

標準回帰係数 b 9 ( ) ( ) 1 n i i i y x b n = =  x, y が標準化されているとき (平均値 0, 分散 1)、 標準回帰係数 b は以下のように計算される

Slide 11

Slide 11 text

(r)2 − r2 10 ( ) 2 2 2 ( ) ( ) ( ) ( ) 2 2 2 1 1 2 ( ) ( ) ( ) ( ) 2 ( ) ( ) ( ) ( ) 2 1 1 2 1 1 2 ( ) ( ) ( ) ( ) 2 1 1 1 2 1 2 1 2 n n i i i i i i n n i i i i n n i i i i i i i i n n i i i i i i r r y x bn y x b n n y x y x y x n y x n n n n y x y x n = = = = = = = =     − = − +                         = − +                       = −               2 2 ( ) ( ) 1 0 n i i i y x =     +             =  よって、 r2 = (r)2