Upgrade to Pro — share decks privately, control downloads, hide ads and more …

A 参考資料

419kfj
October 09, 2023
24

A 参考資料

SSJDA 計量分析セミナー

419kfj

October 09, 2023
Tweet

Transcript

  1. • 「オンライン集計した多重クロスから個票を「回復」する」 • https://rpubs.com/kfj419/1077498 • 「SPSSのsavファイルをRによみこみ、Rのdataframeに変換する」 • https://rpubs.com/kfj419/1077708 • explor

    • https://juba.github.io/explor/ • vcd • https://cran.r-hub.io/web/packages/vcdExtra/vignettes/vcd-tutorial.pdf • https://cran.r-project.org/web/packages/vcd/vignettes/strucplot.pdf
  2. ネット上の情報 • R-waralang slack上のコミュニティ • https://qiita.com/uri/items/5583e91bb5301ed5a4ba • kazurtanさんのR/Studio講座 • https://kazutan.github.io/JSSP2018_spring/intro_rstudio.html

    • kazutanさんのRmarkdown講座 • https://kazutan.github.io/kazutanR/Rmd_intro.html • Heavy wataruさんのdplyrレファレンス。それ以外もあります。 • https://heavywatal.github.io/rstats/dplyr.html
  3. 1984年 CAが英語圏へ 1990年 ? 第5章 注(2) 分析⽅法についてはB.. 理論的基礎付けおよび 論理的利⽤条件につい てはA..

    第1期 1963−73 1973で確立 第2期 1973−80 栄光ある孤立 第3期 1981以降 国際的認知へ 英語文献の 登場 1984 CA英語圏 CA日本語 数量化手法 ブルデュー CAフランス CAの英語圏日本語圏への伝播(翻訳) とDistinctionの英訳、日本語訳の関係 Clausen1989、Rouant&LeRoux2010, Greenacre2017を参 考に作成 CARME 1991から4年ごと に国際会議開催 CAiP B A GDA 参照なし 津⽥塾⼤学紀要 54号(2022/3) ⽤に作成
  4. 因⼦?? • https://www.jehps.net/Decembre2008/Lebart_ang.pdf • ↑9contribution の⼀節。 • 2 Principal axes

    methods (主軸技法) In the French statistics literature, the “analyse factorielle” includes all the representation techniques that use "principal axes ": principal components analysis, simple and multiple correspondences, the analysis in common and specific factors of Spearman and Thurstone, used mainly by psychologists and by psychometricians (factor analysis). • 『デイスタンクシオン』(⽇本語訳)では、この“analyse factorielle” を「因 ⼦分析」としている。 • それと「連動」して、宮島喬・藤⽥英典『⽂化と社会−差異化・構造化・再⽣産 −』有信堂、では、ブルデューアプローチとして「因⼦分析」を⽤いた⽇本社会に おける「⽂化的再⽣産過程」分析が⾏われている。第8章。 • ⼤隅他訳『MCA』⽤語集p162「因⼦分析」に説明あり 2022/2/28 対応分析研究会第11回 ver1.1 9
  5. MAコーディングの問題 • 3.1の式を理解す る鍵。 • disjunctive coding(Crisp coding)故の表の 持つシンプル特性 •

    では、MA回答の ようなものはどう するのか • MCAを適⽤でき ないのか….。 • LeRoux&Rouanet 2004 の説明 p216 2022/2/28 対応分析研究会第11回 ver1.1 10
  6. 追加変数とspeMCAの関係 • Johs先⽣からのメール • Active変数, Supplymentary変数, Passive変数の関係について整理したいと聞 いたことへの返信。 • これは少し複雑な経緯があります。1997/1998年までのMCAの標準

    的なやり⽅は、ジャンクのカテゴリは追加カテゴリとして定義し、 雲の分散を計算するときにそれらを考慮しないことでした。通常、 これは、すべての個体が同じ数の追加カテゴリを持っていないので あれば、個体の⾏の合計が異なってしまうことを意味しました。 • このことは、逆にいくつかの不幸な結果を招きました。その1つは、 重⼼座標が0.00000000000*を座標として持たず、分散分析とMCAの 統合が数学的に正当化できなくなったことなのです。 (*厳密にゼロという表現)
  7. (つづき) • Brigitte Le Rouxは,軸の固有値への寄与を持たずに,周辺分布 に追加カテゴリを含める⽅法を発⾒することによって,これを 解決しました.これにより,Rouanet & Le Rouxがいくつかの

    出版物で⾏ったように,分散分析とMCAを統合することが可能 になり,正当化されるようになったのです。これが,現在では Specific MCAとして知られているもので,ほとんどのソフト ウェアに含まれているオプションです.1990年代末から2000 年代にかけては、必ずしもそうではありませんでした。例えば、 SPADにはMCAとMCAspeという2つのモジュールがありました。 この2つは現在では1つに統合されていますが、両者の根本的な 違いは尊重されています。
  8. Combinatorial Inference in Geometric Data Analysis,Perface(序章)抜粋 • 本書の主な⽬的は、幾何学的データ解析(GDA)における、 より⼀般的には探索的データ解析(EDA)における統計的推定 の問題を直視することである。

    そのEDAでは、通常、仮説検定は、観測データの古典的な分布 の仮定(正規分布、ランダムサンプリング、などなど)は有効 ではなく、結び付けて考えらえていない。 2023/08/30 対応分析研究会第20回 17
  9. ヒントを探して(その1) • タイトルそのまま!『GDAにおける組合せ的推定』 • 執筆者たち • Brigitte Roux • パリ・デカルト⼤学応⽤数学研究所(MAP5/CNRS)およびパ

    リ政治学院政治研究センター(CEVIPOF/CNRS)準研究員。 1970年、パリ科学⼤学で応⽤数学の博⼠論⽂を執筆。 • Solène Bienaise ⭐ • データサイエンティスト。2013年、パリ・ドフィーヌ⼤学でピ エール・カズとブリジット・ルルーの指導の下、応⽤数学の博 ⼠論⽂を完成。 • JEAN-LUC DURAND • パリ第13⼤学⼼理学科の准教授。LEEC(Laboratoire d'Éthologie Expérimentale et Comparée)の研究員。1989年に パリ・デカルト⼤学で⼼理学の博⼠論⽂を執筆、アンリ・ルア ネの指導を受ける • 本書は、 Bienaiseさんの博⼠論⽂を発展させたもの(序章よ り)。 • https://books.google.co.jp/books/about/Combinatorial_Inf erence_in_Geometric_Dat.html?id=ctqMDwAAQBAJ&redir_ esc=y 2023/08/30 対応分析研究会第20回 18
  10. 序章 (抜粋 つづき) • 我々の考えでは、統計的推論は帰納的データ分析(IDA)として実 施されるべきであり、それは記述的データ分析の⾃然な拡張である (Rouanet et al 1990,

    1998)1. 実際、フィッシャー流の推論の伝統は、統計教育では(Tukeyの勇 敢な努⼒にもかかわらず)軽視されていると⾔わざるを得ないが、 研究室の実践ではいまだに⽣きている。この研究者の伝統では、有 意性検定は効果の存在という記述的結論を拡張するための⾃然な道 具である。 まず最初にすべきことは、このような伝統的な推論⽅法を徹底させ ることである。 • 1 実際、IDAは、FisherからTukeyに⾄るまで、Neyman-Pearson学派と強 く対⽴しながら、統計的推測の⻑年にわたる(⾮⽀配的とはいえ)⼀部で あった。 2023/08/30 対応分析研究会第20回 19
  11. はじめに introduction 抜粋 • 1.1 組合せ推論について • 並べ替え検定はリサンプリング法の⼀群に属し,結果を得るためにデータが 繰り返しリサンプリングされ,再調査されることからそう呼ばれる.これら はデータに依存し,分析に必要なすべての情報が観察されたデータに含まれ

    ていると考える.データの分布に関する仮定は必要ない。 並べ替え検定は計算機集約的であるため、実⽤化には強⼒なコンピュータの 出現が必要であり、そのため実際に使⽤されるようになったのはごく最近の ことである。 • 並べ替え検定は,Fisher (1935)とPitman (1937)によって始められ,Romano (1989); Edgington (2007); Pesarin and Salmaso (2010); Good (2011)などに よってさらに開発された2. • 2 統計的並べ替え検定の歴史的発展については,Berry ら (2014)を参照. 2023/08/30 対応分析研究会第20回 20
  12. はじめに introduction 抜粋 つづき • 4 観測値の検定統計量を並べ替え分布上に位置づけることによって、p-値 を決定する。つまり、検定統計量の値が観測値分布のなかで極端であるか、 または観測値と同じくらい極端である再配置の割合を計算する3。 •

    3 有意⽔準に関するこの組み合わせ論的概念は,Freedman and Lane (1983)によっ て提⽰された「⾮確率論的解釈」に正確に対応する.(論⽂PDF取得可能) • 並べ替え検定は⼀般に,正確検定と近似検定の2種類からなる. 正確検定では,検定統計量の並べ替え分布が,観測値のすべての可能な並 べ替え(網羅的⼿法)で,または並べ替えの数が⼤きすぎる場合は,すべ ての可能な並べ替えの無作為部分集合(モンテ・カルロ⼿法)4について 計算される. • 4 アルゴリズムによるシミュレーションを⾏うことは、有意⽔準に相当することに注 意すべきである。 2023/08/30 対応分析研究会第20回 21
  13. データセットリスト • 『対応分析の理論と実践』で使われているデータセット • ⼀覧表がp314に • 原著のsample集 http://www.carme-n.org/?sec=data7 • それを圧縮したものがを圧縮ファイルzipで提供してあります。

    • FactoMineRの付属データ • GDAtoolsの付属データ • 『多重対応分析』で使われているtasteデータ。 • Le Roux先⽣のサイトオリジナルリンク • ラベルを⽇本語化したもの
  14. データ セット 番号 タイトル 使⽤されている章 ページ http://www.carme-n.org/?sec=data7 1私の旅⾏ 第1章 2,

    4 Data set 1: travels.xls (17 KB) 2読者層と教育歴 第3章、第4章 17, 25 Data set 2: readers.xls (39 KB) 3スペイン国⺠健康調査 第6章、第7章、第8章 41, 62 Data set 3: health.xls (25 KB) 第16章 122、 health2.xls (14 KB) 4職員の喫煙習慣 第9章 65 Data set 4: smoke.xls (14 KB) 5科学研究者の評価 第10章 73, 90 Data set 5: funding.xls (74 KB) 6海底試料中の海洋種の 存在量 第10章、第12章 76、90 Data set 6: benthos.xls (197 KB) 76⼈の著者の書籍の⽂字種度数 第10章、第21章、第29章 78, Data set 7: author.xls (24 KB) 8⾷品店の年齢分布 第15章 115 Data set 8: stores.xls (234 KB) 9働く⼥性に対する意⾒ 第16章, 第23章 123 Data set 9: women.xls (14 KB) ISSP1994 第16章 123,181 women2.xls (16 KB) 第17章、第18章、第19章 129 womenraw.xls (2.8 MB) 第17章、第18章、第19章 women3.xls (16 KB) 第17章 women4.xls (19 KB) 第17章 women5.xls (14 KB) 10欧州のニュースの関⼼ 第19章 150 Data set 10: news.xls (35 KB) 11科学と環境に対する態度 第20章 153 Data set 11: science.xls (352 KB) 12時間配分 第22章 172 13働く⼥性に対する意⾒2012 第23章 181 ISSP2012 14社会移動-⽗を息⼦の職業 第24章 185 Data set 12: mobility.xls (25 KB) 15フィレンツェの婚姻ネットワーク 第25章 193 Network:p193 16欧州連合経済指標 第26章 206 Data set 13: EU.xls (22 KB) 17同じ場所の2つの 第28章 221 carme-n にない!
  15. 参考⽂献 CA/MCAの基本⽂献 • Clausen. Sten Erik,1998=2015,”Applied Correspondence Analysis”,SAGE,(訳:藤本⼀男, 2015,『対応分析⼊⾨』オーム社) •

    Le Roux, Brigitte, Henry Rouanet.,2004,Geometric Data Analysis: FromCorrespondence Analysis to Structured DataAnalysis. Dordrecht: KluwerAcademic Publishers • Le Roux, Brigitte, Henry Rouanet.2010,Multiple correspondence analysis.Quantitative applications in the social sciences 163. Thousand Oaks, Calif:Sage Publications(2021,⼤隅昇,⼩野裕亮,鳰真紀⼦.『多重対 応分析』オーム社) • Greenacre, Michael,2017?,”Correspondence Analysis in Practice”,訳:藤本 ⼀男,2020,『対応分析の理論と実践:基礎・応⽤・展開』,オーム社 • Lebart, L.,Morneau, A., & Warwick, KX. M. (1984). MultivariateDescriptiveStatistical Analysis: Correspondence Analysis andRelated Techniques forLarge Matrices, New York: Wiley * (⼤隅昇,L.ルバール,A.モリ ノウ,K.M.ワーウィック,⾺場康維(1994.『記述的多变量解析』(⽇科技運出 版社))
  16. GDAに関する重要⽂献 • Le Roux,Brigitte, Henry Rouanet,1998,Interpreting Axes in MultipleCorrespondenceAnalysis: Method

    of the Contributions of Points and Deviations,Blasius, Jörg, Michael J Greenacre.ed, 1998,Visualization of Categorical Data,CRC press • Henry Rouanet ed,2000,”New ways in statistical methodology: from significance tests to Bayesian inference”, European university studies. Series VI, Psychology : Europäische Hochschulschriften. Reihe VI, Psychologie, • Henry Rouanet.,2006, The Geometric Analysis of Structured Individuals x VariablesTables, “Greenacre, Michael J., Jörg Blasius,ed, 2006, Multiplecorrespondence analysis and related methods” 所収 pp138-159 • Le Roux,Brigitte et al.,2019,”Combinatorial inference in geometric data analysis”,Chapman & Hall/CRC computer science and data analysis series
  17. 参考⽂献 藤本執筆分 • 2015, `On publishing the Japanese translation of

    “Applied correspondence analysis” and its comment part` ,CARME2015, Naples • 2017,「対応分析のグラフを適切に解釈する条件−StandardCoordinate,Principal Coordinateを理解する」『津⽥塾⼤学紀要』第49号、pp141-153 • 2018,「プログラミング⾔語Rにおける2つのmosaicplotと⽇本語、多⾔語表⽰」 『津⽥塾⼤学紀要』第50号、pp129-146 • 2019,「『Supplymentary』変数から多重対応分析(MCA)を考える―幾何学 的データ解析(GDA)と多重対応分析(MCA)―」『津⽥塾⼤学紀要』 第51号、pp156-167 • 2019, “Landscape of CA in Japan and educational perspective”, CARME 2019, Capetown • 2020,「対応分析は<関係>をどのように表現するのか―CA/MCAの基本特性と 分析フレームワークとしてのGDA―」『津⽥塾⼤学紀要』第52号,pp169-184 • 2022,「⽇本における「対応分析」受容の現状を踏まえて、EDA(探索的データ解 析)の中に対応分析を位置付け、新たなデータ解析のアプローチを実現する」 『津⽥塾⼤学紀要』第54号、pp172-193付録 • 2023,「『幾何学的データ解析』は分散をどのように分解するのか−GDAtoolsを⽤ いて原理的な確認を⾏う−」『津⽥塾⼤学紀要』第55号
  18. 組合せ推定 関連⽂献 • ◾⼊⼝ • Le Roux & Rouanet, 2020,

    Multiple Correspondence Analysis, SAGE (⼤隅、⼩ 野、鳰, 2021,『多重対応分析』オーム社)の第5章、帰納的データ解析 (IDA)。典型性検定、同質性検定。 • ◾タイトルそのもので! • Brigitte Roux & Solene Bienaise & Jean-Luc Durand,2019, Combinatorial Inference in Geometric Data Analysis, CRC press • Le Roux & Rouanet,2004, Geometric Data Analysis Correspondence Analysis to Structured Data Analysis, chap8 Inductive Data Analysis, Kluwer Academic Publishers • Henry Rouanet &Marie-Claude Bert,2000(1998),"Chapter 4 Introduction to Combinatorial Inference", New Ways in Statistical Methodology From Significant Test to Bayesian Inference 2nd edition, Peter Lang (第4章 組合 せ推論への導⼊) 2023/08/30 対応分析研究会第20回 28
  19. ◾⾮確率的統計推定 • Freedman, David & Lane, David, 1983, A Nonstochastic

    Interpretation of Reported Significance Levels, Journal of Business & Economic Statistics, Vol.1 No4 Oct 1983,報告された有意⽔ 準の⾮確率的な解釈 • Henry Rouanet, Jean-Marc Berard, and Bruno Lecoutre, 1986, Nonprobabilistic Statistical Inference: A Set-Theoretic Approach, The American Statistician , Vol. 40, No. 1 (Feb., 1986), pp. 60-65 (6 pages), Published By: Taylor & Francis, Ltd. https://www.jstor.org/stable/2683134 ⾮確率的統計的推定: 集合理論(ST:A Set-Theoretic )アプローチ 2023/08/30 対応分析研究会第20回 29