Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
05 CAとMCA事例
Search
419kfj
October 09, 2023
0
42
05 CAとMCA事例
SSJDA計量分析セミナー
対応分析/多重対応分析の原理と実際 05
419kfj
October 09, 2023
Tweet
Share
More Decks by 419kfj
See All by 419kfj
R.Q.(リサーチ・クエスチョン)構築という視点から 伝統的検定手法とベイジアン推定を比較する
419kfj
0
39
多重対応分析/構造化データ解析の原理と研究者視点の介在点「文化と不平等」調査データの分析(1)
419kfj
0
59
Methods and Examples of Correspondence Analysis
419kfj
0
93
01 Introduction
419kfj
0
72
02 ベクトル行列演算とCAの数理
419kfj
0
93
03 CAの数理その2
419kfj
0
39
04 データの準備
419kfj
0
45
06 MCA_01
419kfj
0
40
07 MCAからGDAへ
419kfj
0
71
Featured
See All Featured
Building Applications with DynamoDB
mza
93
6.2k
Side Projects
sachag
452
42k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
99
18k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
Agile that works and the tools we love
rasmusluckow
328
21k
The World Runs on Bad Software
bkeepers
PRO
67
11k
Faster Mobile Websites
deanohume
306
31k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
The Pragmatic Product Professional
lauravandoore
32
6.4k
Transcript
CAとMCA 計量分析セミナー 2023/09/06 藤本⼀男
CA事例と解釈 • データ • smoke.xls で提供される「標準データ」 • 職制と喫煙レベルの模擬データ • Package
• FactoMineR CA本体 • factoextra CAのresultの図⽰ • vcd 元データの表⽰(EDA)mosaic plot • explor CAのresultの動的な表⽰ • 処理の⼿順は、rmarkdownで提供します。
CAをやってみる • データをスクリプトのな かでつくります。 • res.CA <- CA(.d) • グラフを表⽰する
• めでたし、めでたしか? • ともあれ、このグラフか らわかることを⾒てみま す。
グラフからわかること。 • 1軸⽬が「87.8%」2軸⽬が「11.8%」を体現している。 • この%はなにを表しているのか • 1軸⽬にそってみると • 喫煙レベル:原点(全体の中⼼)を折り返し位置として、左に⾮喫煙 (none)、右にheavy,
medium, light が位置している。 • 職制:Juniorは、原点の右側、Seniorは、原点の左側。 • 近いものを探すと… • SEをnone、JMとheavy、mediumとJE。 • これはやってはいけない解釈です。 • このマップ(対称マップ)は、同⼀変数内のカテゴリの近接度合い の解釈は可能だが、別空間にある(⾏変数と列変数)の関係はこの まま(対称マップ)では解釈不可能。
resultを解釈するのに必要な視点 • CA(MCAも同じ)による空間⽣成とはどのようなものなのか。 • CAは分散の分解技法である、と⾔われるのはどのような意味なの か。 • ⽣成される空間の軸をひっぱっているカテゴリはなにか。 • 2種類ある座標の違いはなにか
• 標準座標(standard coordinate) • 主座標(principal coordinate) • ⼀度は数式もみて欲しいのですが*、今回は、グラフとresult表から ⾒ていきます。 • *『対応分析⼊⾨』でも『対応分析の理論と実践』でも解説されてます。
主座標と標準座標 この理解は、CAもMCAも共通です。 Rstudioで出⼒したPDFをみながら説明します。
三つのグラフタイプ • 対称マップ • ⾮対称マップ • ⾮対称マップのバリエーション
分散の分解技法としてのCA プロファイルは、低次元空間に近似されます。 その低次元空間の軸は、新たな「変数」として機能します。 その「変数」の名付けは、どのカテゴリが⼤きく寄与しているかから判断します。
慣性 = χ2値/N N = 193 慣性= 0.08518986 合計すると 0.08518986
合計すると 0.08518986 ⾏空間情報 列空間情報 Dim1合計 Dim2合計 Dim3合計 100% 100% 100% 100% COS2の⾏ 合計は1.00 ⾏ごとにす べて同じ。 ← 合計は、0.0851…
データ表 慣性(分散) 軸1dim1の 慣性(分散) 軸2dim2の 慣性(分散) 軸ndimnの 慣性(分散) : :
CAによる 分散分解 =空間⽣成 列空間も同じ ⾏point dim1 dim2 … dimn point1 point2 : pointn 各pointは、各軸ごとに慣性(分散)持つ 軸ごとの慣性の合計は、分解した軸ごとの固有値に等しい。 その軸内のポイントの割合を寄与率(Contribution)とよび、 軸⽣成への影響割合を⽰す。 pointごとの各軸内の割合をcos2(平⽅相関、相対的寄与率)で あらわし、そのポイントが各軸でどのくらい表現されているかを ⽰す(割合)。 CAでもMCAでも 軸の解釈(名付け) に必要な理解。 分散の分解技 法としてのCA
指⽰⾏列化 I x K(Q) 構造化データ Active変数 残差⾏列 特異値 カテゴリ座標 個体座標
次元縮減で 採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈命名 変数空間分析 追加変数の 個体空間への追加 第3分解:ANOVA 個体空間分析 集中楕円 交互作⽤ CSA 第0分解:元表(Active変数)の分散 (K/Q) -1 第1分解:特異値 分解による ⼆つの空間の⽣成 指標⾏列に対するCA 追加変数(構造因⼦) 構造設計 元表 I x J speMCA 残差⾏列 CSA 残差⾏列 個体/カテゴリのサブセット Dα U V SVD Dim1....n Dim1....n Dim1....n I K 標準座標 主座標
元表 I x J 構造設計 Active変数の表 残差⾏列 特異値 ⾏列 次元縮減で
採⽤する軸 次元縮減の結果 誤差にされる部分 個体空間 変数カテゴリ 空間 第2分解(合成) 座標軸の解釈、命名 変数空間の分析 追加変数の 個体空間への追加 個体空間の 構造分析 第3分解:ANOVA 集中楕円 CSA 第0分解:元表の分散 第1分解:特異値分解による ⼆つの空間の⽣成 指標⾏列に対するCA 第0分解:元表の分散 追加変数 の表