Slide 1

Slide 1 text

正準相関分析 二つの群での相関構造を探る

Slide 2

Slide 2 text

国 数 英 理 社 専門1 専門2 専門3 入学後中間テスト 入試テスト 計算のため、すべてテストごとに正規化しておく 入試テストは5科目・中間テストは3科目であるが、説明のために変数u1,u2,v1,v2としておく 入試テスト側の係数をa、中間テスト側の係数をbとする 合成変数(主成分のような合成指標)を考える Y = a1u1 + a2u2 Z = b1v1 + b2v2 Y,Zのことを第一正準変数 とよぶ。(Y,Zに直交するものを第二とする) Y,Zの相関を第一正準相関係数 とよび、これを最大にするようなa,bを求める

Slide 3

Slide 3 text

Y,Zの相関係数を求めるため、Yの分散,Zの分散,Y,Zの共分散を求める 2 = 1 − 1 ෍ =1 − ത 2 =෌ =1 1 1 + 2 2 2 = 1 2 1 12 12 1 1 2 = 1 2 11 12 21 22 1 2 = 2 2 正規化しているため、YもZも平均は0,分散は1 最大化の際はこれを制約としたラグランジュ法を使う

Slide 4

Slide 4 text

制約により分母は1となるため、最大化するのは , = Z − 1 2 2 − 1 − 1 2 Z 2 − 1 微分して0とおくと − + = 0 − = 0 = = 連立を解くと 以上からa,bを求め、Y,Z(正準相関得点)を計算する

Slide 5

Slide 5 text

正準負荷量 1 − 1 ෍ =1 − ത 1 − 1 = 1 + 2 12 = 1 = 1 21 2 = 1 いま、u1に対して求めた。 これをu2と、Zv1,Zv2についても求める Z1 = 1 + 2 12 Z2 = 1 12 + 2 1 + 2 12 2 12 + 1 主成分負荷量と同じように使用する

Slide 6

Slide 6 text

正準寄与率 第m正準まで作り、その累積で説明できている割合を解釈する。 冗長性係数 Yと他方のv1,v2、Zとu1,u2の相関係数を考える 他方の変数と合成変数との関係を分析する = 1 2 1 2 + 2 2 = 1 2 1 2 + 2 2

Slide 7

Slide 7 text

正準相関分析