Upgrade to Pro — share decks privately, control downloads, hide ads and more …

05 CAとMCA事例

419kfj
October 09, 2023
24

05 CAとMCA事例

SSJDA計量分析セミナー
対応分析/多重対応分析の原理と実際 05

419kfj

October 09, 2023
Tweet

Transcript

  1. CA事例と解釈 • データ • smoke.xls で提供される「標準データ」 • 職制と喫煙レベルの模擬データ • Package

    • FactoMineR CA本体 • factoextra CAのresultの図⽰ • vcd 元データの表⽰(EDA)mosaic plot • explor CAのresultの動的な表⽰ • 処理の⼿順は、rmarkdownで提供します。
  2. CAをやってみる • データをスクリプトのな かでつくります。 • res.CA <- CA(.d) • グラフを表⽰する

    • めでたし、めでたしか? • ともあれ、このグラフか らわかることを⾒てみま す。
  3. グラフからわかること。 • 1軸⽬が「87.8%」2軸⽬が「11.8%」を体現している。 • この%はなにを表しているのか • 1軸⽬にそってみると • 喫煙レベル:原点(全体の中⼼)を折り返し位置として、左に⾮喫煙 (none)、右にheavy,

    medium, light が位置している。 • 職制:Juniorは、原点の右側、Seniorは、原点の左側。 • 近いものを探すと… • SEをnone、JMとheavy、mediumとJE。 • これはやってはいけない解釈です。 • このマップ(対称マップ)は、同⼀変数内のカテゴリの近接度合い の解釈は可能だが、別空間にある(⾏変数と列変数)の関係はこの まま(対称マップ)では解釈不可能。
  4. resultを解釈するのに必要な視点 • CA(MCAも同じ)による空間⽣成とはどのようなものなのか。 • CAは分散の分解技法である、と⾔われるのはどのような意味なの か。 • ⽣成される空間の軸をひっぱっているカテゴリはなにか。 • 2種類ある座標の違いはなにか

    • 標準座標(standard coordinate) • 主座標(principal coordinate) • ⼀度は数式もみて欲しいのですが*、今回は、グラフとresult表から ⾒ていきます。 • *『対応分析⼊⾨』でも『対応分析の理論と実践』でも解説されてます。
  5. 慣性 = χ2値/N N = 193 慣性= 0.08518986 合計すると 0.08518986

    合計すると 0.08518986 ⾏空間情報 列空間情報 Dim1合計 Dim2合計 Dim3合計 100% 100% 100% 100% COS2の⾏ 合計は1.00 ⾏ごとにす べて同じ。 ← 合計は、0.0851…
  6. データ表 慣性(分散) 軸1dim1の 慣性(分散) 軸2dim2の 慣性(分散) 軸ndimnの 慣性(分散) : :

    CAによる 分散分解 =空間⽣成 列空間も同じ ⾏point dim1 dim2 … dimn point1 point2 : pointn 各pointは、各軸ごとに慣性(分散)持つ 軸ごとの慣性の合計は、分解した軸ごとの固有値に等しい。 その軸内のポイントの割合を寄与率(Contribution)とよび、 軸⽣成への影響割合を⽰す。 pointごとの各軸内の割合をcos2(平⽅相関、相対的寄与率)で あらわし、そのポイントが各軸でどのくらい表現されているかを ⽰す(割合)。 CAでもMCAでも 軸の解釈(名付け) に必要な理解。 分散の分解技 法としてのCA
  7. 指⽰⾏列化 I x K(Q) 構造化データ Active変数 残差⾏列 特異値 カテゴリ座標 個体座標

    次元縮減で 採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈命名 変数空間分析 追加変数の 個体空間への追加 第3分解:ANOVA 個体空間分析 集中楕円 交互作⽤ CSA 第0分解:元表(Active変数)の分散 (K/Q) -1 第1分解:特異値 分解による ⼆つの空間の⽣成 指標⾏列に対するCA 追加変数(構造因⼦) 構造設計 元表 I x J speMCA 残差⾏列 CSA 残差⾏列 個体/カテゴリのサブセット Dα U V SVD Dim1....n Dim1....n Dim1....n I K 標準座標 主座標
  8. 元表 I x J 構造設計 Active変数の表 残差⾏列 特異値 ⾏列 次元縮減で

    採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈、命名 変数空間の分析 追加変数の 個体空間への追加 個体空間の 構造分析 第3分解:ANOVA 集中楕円 CSA 第0分解:元表の分散 第1分解:特異値分解による ⼆つの空間の⽣成 指標⾏列に対するCA 第0分解:元表の分散 追加変数 の表