Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
05 CAとMCA事例
Search
419kfj
October 09, 2023
0
18
05 CAとMCA事例
SSJDA計量分析セミナー
対応分析/多重対応分析の原理と実際 05
419kfj
October 09, 2023
Tweet
Share
More Decks by 419kfj
See All by 419kfj
01 Introduction
419kfj
0
39
02 ベクトル行列演算とCAの数理
419kfj
0
41
03 CAの数理その2
419kfj
0
15
04 データの準備
419kfj
0
16
06 MCA_01
419kfj
0
12
07 MCAからGDAへ
419kfj
0
28
08 SDAからIDAへ
419kfj
0
14
A 参考資料
419kfj
0
17
Table of contents
419kfj
0
8
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
16
2.1k
Principles of Awesome APIs and How to Build Them.
keavy
121
16k
10 Git Anti Patterns You Should be Aware of
lemiorhan
648
58k
How to Ace a Technical Interview
jacobian
272
22k
Testing 201, or: Great Expectations
jmmastey
28
6.4k
StorybookのUI Testing Handbookを読んだ
zakiyama
13
4.6k
Pencils Down: Stop Designing & Start Developing
hursman
117
11k
Happy Clients
brianwarren
92
6.4k
A better future with KSS
kneath
231
16k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
104
6.6k
Thoughts on Productivity
jonyablonski
58
3.8k
Product Roadmaps are Hard
iamctodd
44
9.7k
Transcript
CAとMCA 計量分析セミナー 2023/09/06 藤本⼀男
CA事例と解釈 • データ • smoke.xls で提供される「標準データ」 • 職制と喫煙レベルの模擬データ • Package
• FactoMineR CA本体 • factoextra CAのresultの図⽰ • vcd 元データの表⽰(EDA)mosaic plot • explor CAのresultの動的な表⽰ • 処理の⼿順は、rmarkdownで提供します。
CAをやってみる • データをスクリプトのな かでつくります。 • res.CA <- CA(.d) • グラフを表⽰する
• めでたし、めでたしか? • ともあれ、このグラフか らわかることを⾒てみま す。
グラフからわかること。 • 1軸⽬が「87.8%」2軸⽬が「11.8%」を体現している。 • この%はなにを表しているのか • 1軸⽬にそってみると • 喫煙レベル:原点(全体の中⼼)を折り返し位置として、左に⾮喫煙 (none)、右にheavy,
medium, light が位置している。 • 職制:Juniorは、原点の右側、Seniorは、原点の左側。 • 近いものを探すと… • SEをnone、JMとheavy、mediumとJE。 • これはやってはいけない解釈です。 • このマップ(対称マップ)は、同⼀変数内のカテゴリの近接度合い の解釈は可能だが、別空間にある(⾏変数と列変数)の関係はこの まま(対称マップ)では解釈不可能。
resultを解釈するのに必要な視点 • CA(MCAも同じ)による空間⽣成とはどのようなものなのか。 • CAは分散の分解技法である、と⾔われるのはどのような意味なの か。 • ⽣成される空間の軸をひっぱっているカテゴリはなにか。 • 2種類ある座標の違いはなにか
• 標準座標(standard coordinate) • 主座標(principal coordinate) • ⼀度は数式もみて欲しいのですが*、今回は、グラフとresult表から ⾒ていきます。 • *『対応分析⼊⾨』でも『対応分析の理論と実践』でも解説されてます。
主座標と標準座標 この理解は、CAもMCAも共通です。 Rstudioで出⼒したPDFをみながら説明します。
三つのグラフタイプ • 対称マップ • ⾮対称マップ • ⾮対称マップのバリエーション
分散の分解技法としてのCA プロファイルは、低次元空間に近似されます。 その低次元空間の軸は、新たな「変数」として機能します。 その「変数」の名付けは、どのカテゴリが⼤きく寄与しているかから判断します。
慣性 = χ2値/N N = 193 慣性= 0.08518986 合計すると 0.08518986
合計すると 0.08518986 ⾏空間情報 列空間情報 Dim1合計 Dim2合計 Dim3合計 100% 100% 100% 100% COS2の⾏ 合計は1.00 ⾏ごとにす べて同じ。 ← 合計は、0.0851…
データ表 慣性(分散) 軸1dim1の 慣性(分散) 軸2dim2の 慣性(分散) 軸ndimnの 慣性(分散) : :
CAによる 分散分解 =空間⽣成 列空間も同じ ⾏point dim1 dim2 … dimn point1 point2 : pointn 各pointは、各軸ごとに慣性(分散)持つ 軸ごとの慣性の合計は、分解した軸ごとの固有値に等しい。 その軸内のポイントの割合を寄与率(Contribution)とよび、 軸⽣成への影響割合を⽰す。 pointごとの各軸内の割合をcos2(平⽅相関、相対的寄与率)で あらわし、そのポイントが各軸でどのくらい表現されているかを ⽰す(割合)。 CAでもMCAでも 軸の解釈(名付け) に必要な理解。 分散の分解技 法としてのCA
指⽰⾏列化 I x K(Q) 構造化データ Active変数 残差⾏列 特異値 カテゴリ座標 個体座標
次元縮減で 採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈命名 変数空間分析 追加変数の 個体空間への追加 第3分解:ANOVA 個体空間分析 集中楕円 交互作⽤ CSA 第0分解:元表(Active変数)の分散 (K/Q) -1 第1分解:特異値 分解による ⼆つの空間の⽣成 指標⾏列に対するCA 追加変数(構造因⼦) 構造設計 元表 I x J speMCA 残差⾏列 CSA 残差⾏列 個体/カテゴリのサブセット Dα U V SVD Dim1....n Dim1....n Dim1....n I K 標準座標 主座標
元表 I x J 構造設計 Active変数の表 残差⾏列 特異値 ⾏列 次元縮減で
採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈、命名 変数空間の分析 追加変数の 個体空間への追加 個体空間の 構造分析 第3分解:ANOVA 集中楕円 CSA 第0分解:元表の分散 第1分解:特異値分解による ⼆つの空間の⽣成 指標⾏列に対するCA 第0分解:元表の分散 追加変数 の表