Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
05 CAとMCA事例
Search
419kfj
October 09, 2023
0
24
05 CAとMCA事例
SSJDA計量分析セミナー
対応分析/多重対応分析の原理と実際 05
419kfj
October 09, 2023
Tweet
Share
More Decks by 419kfj
See All by 419kfj
多重対応分析/構造化データ解析の原理と研究者視点の介在点「文化と不平等」調査データの分析(1)
419kfj
0
27
Methods and Examples of Correspondence Analysis
419kfj
0
80
01 Introduction
419kfj
0
56
02 ベクトル行列演算とCAの数理
419kfj
0
66
03 CAの数理その2
419kfj
0
23
04 データの準備
419kfj
0
29
06 MCA_01
419kfj
0
27
07 MCAからGDAへ
419kfj
0
54
08 SDAからIDAへ
419kfj
0
24
Featured
See All Featured
Being A Developer After 40
akosma
87
590k
BBQ
matthewcrist
85
9.3k
A Tale of Four Properties
chriscoyier
156
23k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
109
49k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
0
97
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
Thoughts on Productivity
jonyablonski
67
4.3k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
229
52k
Site-Speed That Sticks
csswizardry
0
27
Navigating Team Friction
lara
183
14k
Transcript
CAとMCA 計量分析セミナー 2023/09/06 藤本⼀男
CA事例と解釈 • データ • smoke.xls で提供される「標準データ」 • 職制と喫煙レベルの模擬データ • Package
• FactoMineR CA本体 • factoextra CAのresultの図⽰ • vcd 元データの表⽰(EDA)mosaic plot • explor CAのresultの動的な表⽰ • 処理の⼿順は、rmarkdownで提供します。
CAをやってみる • データをスクリプトのな かでつくります。 • res.CA <- CA(.d) • グラフを表⽰する
• めでたし、めでたしか? • ともあれ、このグラフか らわかることを⾒てみま す。
グラフからわかること。 • 1軸⽬が「87.8%」2軸⽬が「11.8%」を体現している。 • この%はなにを表しているのか • 1軸⽬にそってみると • 喫煙レベル:原点(全体の中⼼)を折り返し位置として、左に⾮喫煙 (none)、右にheavy,
medium, light が位置している。 • 職制:Juniorは、原点の右側、Seniorは、原点の左側。 • 近いものを探すと… • SEをnone、JMとheavy、mediumとJE。 • これはやってはいけない解釈です。 • このマップ(対称マップ)は、同⼀変数内のカテゴリの近接度合い の解釈は可能だが、別空間にある(⾏変数と列変数)の関係はこの まま(対称マップ)では解釈不可能。
resultを解釈するのに必要な視点 • CA(MCAも同じ)による空間⽣成とはどのようなものなのか。 • CAは分散の分解技法である、と⾔われるのはどのような意味なの か。 • ⽣成される空間の軸をひっぱっているカテゴリはなにか。 • 2種類ある座標の違いはなにか
• 標準座標(standard coordinate) • 主座標(principal coordinate) • ⼀度は数式もみて欲しいのですが*、今回は、グラフとresult表から ⾒ていきます。 • *『対応分析⼊⾨』でも『対応分析の理論と実践』でも解説されてます。
主座標と標準座標 この理解は、CAもMCAも共通です。 Rstudioで出⼒したPDFをみながら説明します。
三つのグラフタイプ • 対称マップ • ⾮対称マップ • ⾮対称マップのバリエーション
分散の分解技法としてのCA プロファイルは、低次元空間に近似されます。 その低次元空間の軸は、新たな「変数」として機能します。 その「変数」の名付けは、どのカテゴリが⼤きく寄与しているかから判断します。
慣性 = χ2値/N N = 193 慣性= 0.08518986 合計すると 0.08518986
合計すると 0.08518986 ⾏空間情報 列空間情報 Dim1合計 Dim2合計 Dim3合計 100% 100% 100% 100% COS2の⾏ 合計は1.00 ⾏ごとにす べて同じ。 ← 合計は、0.0851…
データ表 慣性(分散) 軸1dim1の 慣性(分散) 軸2dim2の 慣性(分散) 軸ndimnの 慣性(分散) : :
CAによる 分散分解 =空間⽣成 列空間も同じ ⾏point dim1 dim2 … dimn point1 point2 : pointn 各pointは、各軸ごとに慣性(分散)持つ 軸ごとの慣性の合計は、分解した軸ごとの固有値に等しい。 その軸内のポイントの割合を寄与率(Contribution)とよび、 軸⽣成への影響割合を⽰す。 pointごとの各軸内の割合をcos2(平⽅相関、相対的寄与率)で あらわし、そのポイントが各軸でどのくらい表現されているかを ⽰す(割合)。 CAでもMCAでも 軸の解釈(名付け) に必要な理解。 分散の分解技 法としてのCA
指⽰⾏列化 I x K(Q) 構造化データ Active変数 残差⾏列 特異値 カテゴリ座標 個体座標
次元縮減で 採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈命名 変数空間分析 追加変数の 個体空間への追加 第3分解:ANOVA 個体空間分析 集中楕円 交互作⽤ CSA 第0分解:元表(Active変数)の分散 (K/Q) -1 第1分解:特異値 分解による ⼆つの空間の⽣成 指標⾏列に対するCA 追加変数(構造因⼦) 構造設計 元表 I x J speMCA 残差⾏列 CSA 残差⾏列 個体/カテゴリのサブセット Dα U V SVD Dim1....n Dim1....n Dim1....n I K 標準座標 主座標
元表 I x J 構造設計 Active変数の表 残差⾏列 特異値 ⾏列 次元縮減で
採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈、命名 変数空間の分析 追加変数の 個体空間への追加 個体空間の 構造分析 第3分解:ANOVA 集中楕円 CSA 第0分解:元表の分散 第1分解:特異値分解による ⼆つの空間の⽣成 指標⾏列に対するCA 第0分解:元表の分散 追加変数 の表