対応分析
対応分析 カテゴリカルな主成分分析数量化三類correspondence analysis双対尺度法
View Slide
商品に関するアンケートを実施した数項目あり、はい、いいえでの回答をone-hot表現に変形しておく全100人の回答のうち、はいの回数をカウントしてクロス集計の形式にした商品と項目の共起性(相関)を議論するのが対応分析(双対尺度法、数量化三類はほとんど同じもの)(回答が二択でないとき質問1と質問2のクロス集計もつくることができる)行和と列和を計算する。これは周辺確率として考えられる。項目1 項目2商品1 13 31商品2 15 33商品3 21 5項目1 項目2 行和商品1 13 31 44商品2 15 33 48商品3 21 5 26列和 49 69 総和=118
一点当たりの重さは、集計表の総和で割る。総和 N = 118 で各セルの値を割る。項目1∧商品1であるときの確率(同時確率)として解釈することができる。項目1 項目2 行和商品1 13 31 44商品2 15 33 48商品3 21 5 26列和 49 69 総和=118項目1 項目2商品1 0.11 0.26商品2 0.13 0.28商品3 0.18 0.04同時確率となったクロス集計表を行和して、行和でその行を規格化する。(プロフィル)この値の解釈は、行に関する条件付き確率となる。列方向にもプロフィルする。比率になおしている項目1 項目2 行和商品1 0.11 0.26 0.37商品2 0.13 0.28 0.41商品3 0.18 0.04 0.22項目1 項目2商品1 0.3 0.7商品2 0.31 0.69商品3 0.81 0.19
項目1 項目2 行和商品1 0.11 0.26 0.37商品2 0.13 0.28 0.41商品3 0.18 0.04 0.220.42 0.58項目1 項目2商品1 0.3 0.7商品2 0.31 0.69商品3 0.81 0.19項目1 項目2商品1 0.26 0.45商品2 0.31 0.48商品3 0.43 0.07規格化:行規格化:列この値は図として理解すると、変数1,2、もしくは行1,2,3が合計1となる平面上(超平面・直線)に存在するようになる
項目1 項目2商品1 0.3 0.7商品2 0.31 0.69商品3 0.81 0.19項目1 項目2商品1 0.26 0.45商品2 0.31 0.48商品3 0.43 0.071 項目11 商品1商品2商品3項目2111三次元空間上の2点二次元空間上の3点
項目1 項目2商品1 f11 f21商品2 f12 f22商品3 f13 f23同時確率項目1 項目2商品1 p11 p21商品2 p12 p22商品3 p13 p23項目1 項目2商品1 q11 q21商品2 q12 q22商品3 q13 q23規格化:行
項目1 項目2商品1 f11 f21商品2 f12 f22商品3 f13 f23=++√(j列目の列和) (i行目の行和)行和を外に出す方法も見られた=++=++これはp_ij に対して行っても同じ
=++質的データはそのままでは件数が多いか少ないか、という情報しかもっていない数値の関係性を表すための計算方法が研究者達がいくつか考案した数値的な距離関係を表すためにBenzecriはカイ二乗距離を考えた=11++− +2=カイ二乗統計量を使った場合には−++2++平方根を計算して √n ∗−++++√nを取り除くと =++ා=1++−++2
=++項目1 項目2商品1 x11 x21商品2 x12 x22商品3 x13 x23=++Xの行列を主成分分析(固有値・固有ベクトル)する主成分得点(カテゴリスコア,数量化得点)は、主成分軸上の座標であり、クロス集計表によって得られた質的変数を低次元にマッピングすることが可能となる行に対するXだけでなく、列に対するXも求めて主成分分析する。(項目に対する主成分分析と、商品に対する主成分分析を行う。)
得られたクロス集計表の行と列に対する主成分得点の寄与率を確認して第2主成分までの寄与率がたかければbiplotによって二次元表現することで、クロス集計表の行列の関係を視覚的に確認できる。
項目1 項目2商品1 f11 f21商品2 f12 f22商品3 f13 f23同時確率項目1 項目2商品1 p11 p21商品2 p12 p22商品3 p13 p23行列π_PQとする周辺確率(行和p_i+,列和p_+j)を対角成分にもつものをπ_p = diag(p_i+)π_q = diag(p_+j)とする。
=++ = −1−12 = − ҧ − ҧ − ҧ ҧℎ = ℎ= =1ℎ= =1ℎ++ = −1−12固有ベクトルHとデータから数量化得点をもとめるこれをPに関してだけでなく、Qに関しても求める。単純にX(π)を転置して求めていく