Upgrade to Pro — share decks privately, control downloads, hide ads and more …

対応分析研究会 第6回報告スライド

対応分析研究会 第6回報告スライド

『対応分析の理論と実践』オーム社刊2020、の第10章、11方の報告

419kfj

May 23, 2021
Tweet

More Decks by 419kfj

Other Decks in Research

Transcript

  1. 第7章 最適化尺度 法 第6章 次元を縮減 する 第5章 Χ2距離をプ ロットする 第4章

    Χ2距離と慣 性 第1章 散布図と マップ 第2章 プロファイ ルとプロファイル 空間 第3章 質量と重⼼ 2つの量変数の関係を⾒る → 散布図 カテゴリカル変数をどう扱うか 距離! CAの基本概念:プロファイル それが位置するプロファイル 空間。三⾓座標でみていく。 プロファイル:周辺度数→質量 頂点とプロファイル、 平均プロファイル(期待値プロ ファイル)、重⼼ 距離: Χ2距離 慣性: Χ2値/n(プロファイル値で 表現) 最⼤慣性:頂点に⼀致 最⼩慣性:原点(重⼼)に⼀致 Χ2距離をユークリッド距離 に変換し図⽰する。 分布の同等性(分布的に等価) ここまで3次元。これからより 多数の次元を扱う。 低次元下位空間を同定する(回帰 との⽐較) SVD:特異値分解 近似:表⽰の質 第10章 さらに3つ の事例 DS5:科学研究者の評価 DS6:海底試料中海洋種 DS7:著者ごとの⽂字種 慣性の分解 ⾮対称マップ/対称マップ 慣性の⼤きさによる表⽰ の特徴 第9章 2次元表⽰ 主軸のネスティング プロファイルと頂点 ⾮対称マップ/対称マップ 第8章 ⾏分析と列 分析の対称性 頂点位置とプロファイル スケーリング係数 主座標と標準座標 正準相関:最⼤化 整数尺度(likert) 解釈の基準 プロファイル空間の幾何学(1) プロファイル空間の幾何学(2) 2021/5/22 対応分析研究会 第6回 3 DS1 DS2 DS3 DS4
  2. DS5:科学研究者の評価 第10章 3つの典型 事例 2021/5/22 DS5:科学研究者の評価 DS6:海底試料中海洋種 DS7:著者ごとの⽂字種 慣性の分解 ⾮対称マップ/対称マップ

    慣性の⼤きさによる表⽰ の特徴 第11章 慣性の分解 第12章 サプリメン タリ・ポイント 第13章 対応分析バ イプロット 第14章 推移と回帰 の関係 第15章 ⾏と列のク ラスタリング 第16章 多重表 第17章 積み重ね表 第18章 多重対応分 析 第19章 同時対応分 析 第20章MCAのス ケーリング特性 第21章 サブセット 対応分析 DS5:科学研究者の評価 DS5:科学研究者の評価 DS5:科学研究者の評価 DS5:科学研究者の評価 DS8:⾷品店における 年齢分布 DS3:健康⾃⼰評価 組み合わせコーディング DS9:働く⼥性に対する 態度 DS9:働く⼥性に対する 態度 DS9:働く⼥性に対する 態度 第21章 サブセット 対応分析 第21章 サブセット 対応分析 第21章 サブセット 対応分析 第21章 サブセット 対応分析 〜 30章まで 対応分析研究会 第6回 4
  3. 3つの事例の概要 • データセット5 科学研究者の評価(10 x 5) • プロファイル・ポイントの分散は⼩さい(原点近くに密集) • ⾮対称マップと対称マップ

    • 次元解釈の⼿順 • データセット6 海底資料中の海洋種の存在量(92 x 13) • 海洋⽣物学における典型的なデータセット • データセット7 6⼈の著者ごとの書籍にみる⽂字種の度数(12x 26) 2021/5/22 対応分析研究会 第6回 6
  4. ⼿順 • データを⽤意する • この事例はExcelファイル • データセット:http://www.carme-n.org/ • 読み込む •

    PCにダウンロード • クロス表に対する基礎的分析はしておく。 • χ2検定、⾏分析、列分析(mosaic plot) • CAに投げる • res.CA <- CA(データ) • resultを評価する • スクリープロット(慣性の分解度合い) • ⾮対称マップ、対称マップで概要確認 • 空間(⾮対称マップの標準座標の⽅の軸)へのプロファイルポイントの寄与を確認。→ 軸の性格付 け • (このあと、サプリメタリ処理をして再度CAとか続く) 2021/5/22 対応分析研究会 第6回 7
  5. グラフ化 • reslutを描画する • 探索過程でのグラフ化 • 最終出⼒としてのグラフ化 • オプション •

    対称マップ • ⾮対称マップ • インターラクティブ・グラフ • explor • グラフのポイントへの修飾 • ⽮印表⽰ • ポイント間を線分でつなぐ(形状、⾊、太さ) 2021/5/22 対応分析研究会 第6回 9
  6. 事例1 データセット5科学研究者評価 • 研究費の配分が⽬的 • 5つのカテゴリー:A〜E • 796⼈ • 10の専⾨分野

    • Data set 5: funding.xls (74 KB) Evaluation of scientific researchers (chapter 10) 2021/5/22 対応分析研究会 第6回 10
  7. 慣性の分解 n⾏m列 の多次元 空間 min(n, m)-1 次元空間に再構成 各軸ごと(Dim1〜3…)に慣性が分解される(分解1) 固有値:スクリープロット 各軸が全体の何%を体現しているか

    慣性=χ2/N Dim1 Dim2 Dim3 Dim1 Dim2 Dim3 各軸 (Dim1〜3…)の⽣成に各ポイントがどれだけ 寄与しているか(分解3) ポイントごとに各軸への寄与率を合計すると1にな る。 絶対的寄与率(CONTR) Dim1 Dim2 Dim3 ポイントが、各軸でどれだけ表現されているか。 (分解4) ポイントごとに各軸(Dim1〜3…)を合計すると1 になる。 表⽰の「質」相対的寄与率(COS2) 部分空間の表⽰の質は、部分空間を形成する軸ごと の相対的寄与率の合計。 2021/5/22 対応分析研究会 第6回 29 各プロファイルが体現している慣性(分解2−1) 各セルが体現している慣性(分解2−2) prof3 prof4 prof5 prof1 cell1.1 cell1,2 cell1.2 prof2 cell2.1 cell2.2 cell2.3 : : Exhibit11.1 Exhibit11.2 Exhibit11.3 Exhibit11.4 Exhibit11.5 Exhibit11.6 Exhibit11.8
  8. ⼆つの寄与率 (分解3、4) • 絶対的寄与(分解3) • 座標軸へのプロファイル・ポイントの寄与 • 軸の解釈の根拠 • 相対的寄与(分解4)

    • 各軸がプロファイル・ポイントをどれだけ表現しているか • 注⽬している軸でそのポイントの何%が表現されているか。 • ポイントと軸の相関係数 • 1−2軸(部分空間)でのポイントの表現の「質」 • 1軸、2軸での相対的寄与(cos2θ)の和 2021/5/22 対応分析研究会 第6回 38