Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「学術的に理解する」ってどういうこと? :統計的因果推論のフレームワークから見た 「量的×質的」に関する眺望の (いささかとっちらかった)スケッチを共有する

「学術的に理解する」ってどういうこと? :統計的因果推論のフレームワークから見た 「量的×質的」に関する眺望の (いささかとっちらかった)スケッチを共有する

統計的因果推論のフレームワークとはいかなるものかを理解することで、統計的因果推論がいかに質的な知見を(しばしば暗黙に)その基盤としているか、統計的因果推論のスコープがしばしば いかに”狭い&薄い”のかを議論しました。前半はDAG-潜在結果モデル-構造的因果モデルの統一的な解説です。後半はSUTVAと質的研究の話、固有性-法則性と斎藤清二先生のナラエビの話、筒井淳也(2019)と"キャンセルアウト"の是非の話、です。

takehikoihayashi

August 04, 2021
Tweet

More Decks by takehikoihayashi

Other Decks in Research

Transcript

  1. ⾃⼰紹介|どんな研究をしているのか もともとの出⾝は⽣態学(性淘汰・種分化理論) 『性選択理論を整理する』 (性淘汰理論を統⼀的に解説) 種分化過程の個体ベース シミュレーション研究 Figure 2. The distribution

    of locus effects in the genetic distance model with two loci. (A) Differentiation in the female locus only (th “Buridan’s Ass” regime). The population is from the simulation shown in Figure 1B at generation 7500. (B) Differentiation in both femal and male loci. The population is from the simulation shown in Figure 1B at generation 25,000. (C) Sympatric speciation with strong sexua conflict (Popt = 0.2). Upper white bars: female locus. Lower black bars: male locus. Parameters are the same as in Figure 1B unless specified case) of a haploid network when genetic diversification in both sexes occurred. It shows a population consisting of small, loosely connected clusters, rather than large and distinct clusters. The web structure among clusters shows that recombinant genotypes were common in the population. With the same parameter configuration, genetic differentia- tion is more likely in the eight-locus model (Table 2a) than in the two-locus model (Table 1a). This partly reflects the difference in the strength of selection pressure on each locus. When the number of loci is small, the selection pressure on each locus is strong and tends to suppress the genetic variance required to initiate genetic differentiation. Moreover, differentiation rarely occurs once co- evolutionary chase begins. In contrast, genetic differentiation is still possible even when coevolutionary chase occurs in one of the Figure 3. Examples of haplotype networks. The ovals represent groups of individuals with the same haplotype. The length of a branc (more precisely, the number of nodes between clusters) represents the distance between haplotypes. These haplotype networks wer computed based on 50 individuals randomly sampled at generation 25,000. Parameters: Popt = 0.2, ␣ = 0.01, sc = 1.02, ␮ = 0.5 × 10−5 N = 10,000, unless specified. (A) Sympatric speciation in the two-locus genetic distance model with codominance. The data are from th simulation run shown in Figure 2C, ␣ = 0.05. (B) Genetic diversification without speciation in the eight-locus genetic distance mode with directional dominance. The data are from the simulation run shown in Figure 4A. (C) Sympatric speciation in the eight-locus geneti distance model with codominance, sc = 4 × 1.02. (D) Genetic diversification without speciation in the 32-locus genetic distance mode pairs of loci, provided that the number of loci is moderate (e.g L = 8). The codominance case.—Genetic differentiation in th loci of both sexes was often observed (Fig. 4B and Table 2b), al though the frequency of differentiation in male loci was smalle than in the directional dominance case. When selection in female was not sufficiently strong (i.e., sc = 1.02), no sympatric speci ation was observed (because of recombination among divergin loci). Strong female preference (␣ = 0.05) enhanced genetic dif ferentiations in the loci of both sexes but did not cause sympatri speciation (Table 2c). Decreased mutation rate (␮ = 10−5) sup pressed genetic differentiation, especially in male loci (Table 2d) No diversification was observed when population size was smal (N = 1000). 配偶者選択の基準が多様化することにより、 集団内に遺伝的⽂化が⽣じる過程を研究 ORIGINAL ARTICLE doi:10.1111/j.1558-5646.2007.00059.x GENETIC DIFFERENTIATION BY SEXUAL CONFLICT Takehiko I. Hayashi,1,2 Michael Vose,3,4 and Sergey Gavrilets5,6 1Research Center for Chemical Risk Management, National Institute of Advanced Industrial Science and Technology, 16-1 Onogawa, Tsukuba, Ibaraki 305-8589, Japan 2E-mail: [email protected] 3Department of Computer Sciences, University of Tennessee, Knoxville, Tennessee 37996 4E-mail: [email protected] 5Department of Ecology and Evolutionary Biology, Department of Mathematics, University of Tennessee, Knoxville, Tennessee 37996 6E-mail: [email protected] Received June 6, 2006 Accepted October 31, 2006 Sexual conflict has been suggested as a general cause of genetic diversification in reproductive characters, and as a possible cause of speciation. We use individual-based simulations to study the dynamics of sexual conflict in an isolated diploid population with no spatial structure. To explore the effects of genetic details, we consider two different types of interlocus interaction between female and male traits, and three different types of intra-locus interaction. In the simulations, sexual conflict resulted in at least the following five regimes: (1) continuous coevolutionary chase, (2) evolution toward an equilibrium, (3) cyclic coevolution, (4) extensive genetic differentiation in female traits/genes only, and (5) extensive genetic differentiation in both male and female traits/genes. Genetic differentiation was hardly observed when the traits involved in reproduction were determined additively and interacted in a trait-by-trait way. When the traits interacted in a component-by-component way, genetic differentiation was frequently observed under relatively broad conditions. The likelihood of genetic differentiation largely depended on the number of loci and the type of within-locus dominance. With multiple loci per trait, genetic differentiation was often observed but sympatric speciation was typically hindered by recombination. Sympatric speciation was possible but only under restrictive conditions. Our simulations also highlight the importance of stochastic effects in the dynamics of sexual conflict. Hayashi et al. (2006) 研究の原点はフィールド観察にある、という感覚のある分野
  2. ⾃⼰紹介|どんな研究をしているのか ⽣態リスク評価、確率的リスク分析、因果推論 Yij θAlgae σj Means SD θFish Sensitivity differences

    among taxonomic groups Normal distributions Log(NOEC) Parameters were estimated by MCMC simulations θInvertebrate 階層ベイズモデルとモンテカルロシミュレーションを ⽤いた化学物質の⽣態リスクの定量化とリスク⽐較 Hayashi & Kashiwagi (2009) Hayashi & Kashiwagi (2010) Monte Carlo Analysis EPAF = F µ ECD - µ SSD s ECD 2 + s SSD 2 æ è ç ç ö ø ÷ ÷ µ ECD µ SSD s ECD s SSD Calculation of predictive distribution of EPAF Posterior distributions of ECD parameters Posterior distributions of SSD parameters Results: Quantitative Risk Comparison Median and 90% range of EPAF log10(EPAF) Large Risk→ ←Small Risk Chemicals Ammonia Copper Nickel Zinc Hayashi and Kashiwagi (2011) リスク/影響の確率論的解釈(個別-法則)
  3. ⾃⼰紹介|どんな研究をしているのか 『はじめてのバックドア基準』 (Pearlの関数的因果モデルの解説) ⽣態リスク評価、確率的リスク分析、因果推論 ネオニコチノイド系農薬の ⾚トンボへの影響の因果推論 !",$ = &",$ −

    &"(),$ &"(),$ = +) ,-./)," − ,-./),"() + ⋯ + +2 ,-./2," − ,-./2,"() ++" 3-45" + 6) 7)," + ⋯ + 68 78,"                 背景知識からの因果モデルの構築 バックドア基準に基づく 統計モデルの構築 因果効果の推定 Takeshita et al. (2020)など 介⼊効果とドメイン知識
  4. ⾃⼰紹介|どんな研究をしているのか 社会対話、リスクコミュニケーション、EBPM “エビデンス”を政策利⽤する上で考慮されるべき論点を 科学哲学者との共同研究により5x3表の形で整理 Environmental Science and Policy 116 (2021)

    86–95 Fig. 1. Cross table of managerial points for EBPM in environmental policymaking. Note. Each perspective comprises of two levels: the issues involved in each phase, and a checklist for managing each stage in EBPM. H. Kano and T.I. Hayashi Environmental Science and Policy 116 (2021) 86–95 A framework for implementing evidence in policymaking: Perspectives and phases of evidence evaluation in the science-policy interaction Hiroyuki Kano a,*, Takehiko I. Hayashi b a Graduate School of Human Sciences, Osaka University, 1-2 Yamadaoka, Suita, Osaka, 565-0871, Japan b Center for Health and Environmental Risk Research, National Institute for Environmental Studies, 16-2 Onogawa, Tsukuba, Ibaraki, 305-8506, Japan A R T I C L E I N F O Keywords: Evidence-based policy Science-policy interface Reference guide Institutionalization Mercury A B S T R A C T The use of scientific knowledge in policymaking has been a subject of debate in the environmental sector. An essential task for the effective use of evidence in policymaking is for scientists and policymakers to share a common understanding of how evidence should be produced and used. The purpose of this study is to establish a reference framework that enables scientists and policymakers to align their sights to deal with evidence in policymaking. To develop the framework, we introduced five perspectives that cover the domains of science, policy, and the science-policy interface as: (1) methodological rigorousness; (2) consistency; (3) proximity; (4) social appropriateness; and (5) legitimacy. We then examined how the issues from these perspectives will transit through three phases of interaction between scientific investigation and political institutionalization via: (1) a pre-institutionalization phase, in which the academic and social framing of an issue was unclear; (2) a mid- institutionalization phase, in which the academic and social framing of an issue was established and institu- tionalization was advanced; and (3) a post-institutionalization phase, in which issues were recursively defined within the evidence evaluation system itself. The framework encourages scientists and policymakers to shift their perspectives to each phase of institutionalization. A case study on mercury pollution shows how the framework serves as a checklist for the comprehensive evaluation of evidence, which provides specific guidance that appropriately promotes evidence-based policymaking and its implementation. 1. Introduction The use of scientific knowledge in policymaking has been a subject of debate in the environmental sector. Although evidence-based policy- making has been advocated over the last twenty years, the idea has not transparent process for incorporating research evidence into policy de- cisions (Dicks et al., 2014); a systematic climate policy evaluation (Haug et al., 2010); a participatory and inclusive structures for policymaking (Lalor and Hickey, 2014); social interactions, socio-political environ- ments, and power relations in the knowledge production and its use Contents lists available at ScienceDirect Environmental Science and Policy journal homepage: www.elsevier.com/locate/envsci Kano and Hayashi (2021) “エビデンス”と公共政策
  5. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(IV部構成) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在結果モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  6. 前置き:反事実条件⽂と因果概念の定義 • 可能世界論からの「必然性」「可能性」の考え⽅ 「可能世界」の枠組みで考えれば⾊々と 捗るよ! S.クリプキ (1940-) 「Xが必然である」とは? 全ての可能世界においてXが成り⽴つ 「Xが可能である」とは?

    少なくとも1つの可能世界においてXが成り⽴つ ・世界について考えうる異なる「あり⽅」ごとに異なる 「可能世界」がある ・その中で我々が実際に暮らしているのこの世界が 「現実世界」 可能世界を考えることで、「必然性」や「可能性」という概念を 論理的に定式化できる image
  7. 前置き:反事実条件⽂と因果概念の定義 • 反事実依存性と「因果推論の根本問題」 「同じ状況(到達可能な近傍の可能世界)において、もしも Xが起こらなければ、Yは起こらなかっただろう」 因果効果を次のように定義できそう: X→Yへの因果効果 =出来事Xが起きた世界におけるY - 出来事Xが起きなかった世界におけるY

    しかし、「起きた世界」と「起きなかった世界」の両⽅ を同時に観測することは原理的に不可能 “因果推論の根本問題” どちらかは必ず 反事実的な世界となる 例. コロナ禍 “反事実的な世界”を 統計的に構成することにより この「根本問題」を解決するのが 「統計的因果推論」である (起こらなかった⽅の可能世界)
  8. 本⽇のテーマのプレビュー v IL Morgan and Winship (2014) 『Counterfactuals and Causal

    Inference: Methods and Principles for Social Research』 (2nd ed.) 本⽇の”こころの元ネタ” 今回具体的にこの本の内容の話をする わけではないが、話のスコープの 根っこにはこの本のモチーフがあります
  9. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  10. 前置き|統計的推測の主要な3⽬的 ⽬的の 分類 やりたいことの内容 事例のイメージ (⼤学の留年の例で) 理念的な理想をなす 解析法のイメージ しばしば 現実的な

    解析法 予測 現在得られている情報 から、将来/未知の値 /状況を予測したい (要因への介⼊は伴わない場合) 多数の変数の情報から、留年 リスクの⾼い学⽣を⾒つけた い(→その後の⽀援につなげ るなど) 機械学習 回帰分析! 説明・記述 要素間の関連性を説明 したい なぜ学⽣が留年するかを説明 したい(要因を探索し理解/ 対策につなげたい) フルスタックの 構造⽅程式 (含む因⼦分析等) 回帰分析! 因果/介⼊ 効果の推定 ある要因Xに介⼊したと きの、要因Yに及ぼす効 果を知りたい 特定のプログラムの導⼊が留 年を防⽌する効果を知りたい ランダム化⽐較試験 回帰分析! ⼀⾒同じ「回帰分析」でも、⽬的に応じて係数の 解釈のあり⽅も、重要となる仮定群も異なる (異論は認める) * *互いに排反な分類という意味ではないので注意 ↑ パートI,IIでは「因果効果の推定」が主テーマ ▪ (余談)
  11. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  12. 前置き パートIのテーマ:「構造」と「差分」の視点の統合 「対象を理解すること」にとって 統計的因果推論とは何か? ⾮巡回有向グラフ(DAG) 潜在結果モデル 構造的因果モデル 𝒀 = 𝑿𝒀𝟏

    + (𝟏 − 𝑿)𝒀𝟎 X Y Z1 Z2 Z3 Average Causal Effect = 𝑬[𝒀𝟏] − 𝑬[𝒀𝟎] 𝑋: = 𝑔: 𝑝𝑎 𝑋: , 𝜀: 𝑖 = 1, … , 𝑝 「差異からみた因果」 「構造からみた因果」
  13. 1. 構造から⾒た統計的因果推論 :DAGとバックドア基準の⼊⾨ 2. 差分から⾒た統計的因果推論 :潜在結果モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在結果モデルのSCMによる表現 (3) 潜在結果モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へ パートIの⽬次 0. 序:因果と相関と「対象の多様なありよう」
  14. 1. 構造から⾒た統計的因果推論 :DAGとバックドア基準の⼊⾨ 2. 差分から⾒た統計的因果推論 :潜在結果モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在結果モデルのSCMによる表現 (3) 潜在結果モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へ パートIの⽬次 0. 序:因果と相関と「対象の多様なありよう」
  15. 3 8 12 16 20 −1 0 1 2 3

    8 12 16 20 −1 0 1 2 3 相関と因果がズレるとき| なし あり 肥料X 糖 度 Y 「肥料X→リンゴの糖度Y」の散布図(1品種ver) +2.1 各処理グループ 平均の差(+2.1) 「真の因果効果(+2)」 ≒ 散布図上での差を 因果効果として そのまま解釈可能 =バイアスなし ここでのバイアスの定義= 「真の因果効果」と「観測された処理 グループ平均の差」の系統的なズレ
  16. 3 8 −1 0 1 2 3 3 8 12

    16 20 −1 0 1 2 3 相関と因果がズレるとき| なし あり 肥料X 糖 度 Y 「肥料X→リンゴの糖度Y」の散布図(2品種ver) +4.4 各処理グループ 平均の差(+4.4) 「真の因果効果(+2)」 ≠ (他の設定は同⼀でも) 2種類の品種が 混在するだけで バイアスが⽣じる ここでのバイアスの定義= 「真の因果効果」と「観測された処理 グループ平均の差」の系統的なズレ
  17. 相関と因果がズレるとき| 品種が混在するときは必ずバイアスが⽣じる? 8 12 −1 0 1 2 3 8

    12 −1 0 1 2 3 8 12 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 20 20 20 +4.4 +2.0 -0.8 なし あり 肥料X 糖 度 Y なし あり 肥料X なし あり 肥料X 40/10 10/40 25/25 25/25 40/10 10/40 「品種の⽐率」が処理グループ間で同じとき にはバイアスが⽣じない ぺこ/すまいる比(総数ではぺこ50個/すまいる50個)
  18. 8 12 −1 0 1 2 3 8 12 −1

    0 1 2 3 8 12 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 相関と因果がズレるとき| 品種が混在するときは必ずバイアスが⽣じる? +3.3 +2.2 +0.8 なし あり 肥料X 糖 度 Y なし あり 肥料X なし あり 肥料X ぺこ/すまいる比 8/42 2/48 5/45 5/45 8/42 2/48 「品種の⽐率」が処理グループ間で同じとき にはバイアスが⽣じない (総数ではぺこ10個/すまいる90個) ここ⼤事
  19. 相関と因果がズレるとき| 対処例:層別化による処理と共変量の「独⽴化」 鱿鱘ݸ 鱞鲃鱉鲐ݸ 鱿鱘ݸ 鱞鲃鱉鲐ݸ ʮංྉ9鱇鲏ʯ鱳಺༁ ʮංྉ9鱯鱜ʯ鱳಺༁ ౶ ౓

    ංྉ9 鱯鱜 鱇鲏  ౶ ౓ ංྉ9 鱯鱜 鱇鲏  ౶ ౓ ංྉ9 鱯鱜 鱇鲏  『 』 層別解析 『 』 層別解析 層別化で処理間の共変量を 揃える→バイアスが消える
  20. 導⼊|相関と因果は違う 散布図上の相関関係からの素朴な予測や期待と 因果効果(介⼊効果)がズレることがある ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬

    ͷ छ ਺ : p < 0.001 「Xが⼩さいとき、Yは⼤きい」 (=相関関係がある)とほぼ確実に⾔える 「Xを⼩さくすると、Yは⼤きくなる」 (=因果関係がある)と⾔えるか?
  21. 導⼊|相関と因果は違う もしYの状態がXにより部分的に⽣じているなら ば、Xを減少させればYは部分的に回復する ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬

    ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ 「Xを⼩さくすると、Yは⼤きくなる」かは Yの状態が何によって⽣じているかに依存する
  22. 導⼊|相関と因果で必要とされる⽅法論が違う p(Y|X=⼩さい) Xが⼩さいときのYの計算 p(Y|X=do(⼩さい)) Xを⼩さくしたときのYの計算 因果の問題 相関の問題 p(Y|X=see(⼩さい)) あるいは、いうなれば なぜズレるの?

    交絡のせい! 内⽣性のせい! ⼀歩込み⼊った議論をする際に判断に迷うことがある 最初の ⽬標 「バックドアパスが開いているせい」 「バックドア基準が満たされていないせい」 とい説明の仕⽅・概念を理解する association
  23. 超ざっくり説明|”バックドアパス”とは? 「バックドアパス」=『処理Xと結果Yの上 流側にある両者に影響を与える流れ』 ▪ X Y Z1 Z2 (X→Yの) バックドアパス

    ではない! 上流側にある「Z1」に インクをぶちまけても Xにしか到達しない (=両者には影響を与えない) *Xそのものを通してYへ繋がる 流れはノーカウント
  24. 超ざっくり説明|バックドアパスの何が問題? 上流側の変動に伴い”シンクロ”が⽣じる ▪ X Y Z X Y Zの変動によりX-Y間に "シンクロ"が⽣じる

    Zが⼤ Zが⼩ (X→Yの) バックドアパス このZの変動によるシンクロが”疑似相関”を⽣み、 X→Yの介⼊効果の推定にバイアスをもたらす ⾮因果的 連関
  25. 超ざっくり説明|バックドアパスが”閉じる”とは? バックドアパスが”閉じる”=バックドアパス 上の変数を”固定”する ▪ X Y Z Zを“固定”する バックドアパスが”閉じ” 交絡の影響が消える

    シンクロを⽣む流れが “ブロック”される Zで層別化して解析 重回帰分析の共変量としてZをモデルに追加 “固定”= 条件付けconditioning の⼿法の例 ・ ・
  26. 超ざっくり説明|バックドアパスが”閉じる”とは? 参考:Zでの層別化(X:汚染濃度, Y:種数, Z:流域) ▪ 「上流」「下流」の層別に X→Yの効果を計算して集計する Z:流域 X:汚染 濃度

    Y:種数 流域Zを層別化により”固定”し解析することで交絡 の影響が消え、介⼊効果がバイアスなく推定できる ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬ ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ
  27. 超ざっくり説明|パスが”開きっぱなし”とは? バックドアパスが開きっぱなし=変数が固定 されずパスの流れが”ブロック”されていない ▪ X Y Z X Y Zの変動によりX-Y間に

    "シンクロ"が⽣じる Zが⼤ Zが⼩ (X→Yの) バックドアパス ⾮因果的 連関 介⼊効果の推定のバイアスが調整されぬまま残る
  28. 超ざっくり追記|固定により”開く”こともある 参考:合流点となる「合否」を”固定” ▪ 実 技 試 験 Z:合否 Y:実技 試験

    美⼤の⼊学試験における仮想例 合否Zで層別化すると、XとYの間に⾮因果的な連関 が⽣じ、X→Yの介⼊効果の推定にバイアスが⽣じる 合格者 Z=1 不合格者 Z=0 X:学⼒ 試験 100 100 学⼒試験 合 格 ラ イ ン
  29. 具体例でおさらい|3変量(X, Y, Z)の場合 3変量で⾒る”ほぼ バックドア基準” ▪ X Y Z )

    X Y Z ) X Z Y ( ) Zを加えよ Zを加えるな *3変量の場合では、巷の”rule-of-thumb”的な変数選択 ルール以上のご利益はあまり感じられないかも
  30. 4変量以上の場合|本質は”道”にあり 4変量以上の”道”:合流点の例 ▪ Z1 X Z2 Y Z3 Z1 X

    Y Z3 X Z2 Y Z3 X→Y   Z1 Z2 X Y Z3 Z1 Z2 バックドアパスが "開いている" バックドアパスは"閉まっている" バックドアパスの”道”がブロック されていることが肝要
  31. 4変量以上の場合|本質は”道”にあり 4変量以上の”道”:中間点の場合 ▪ X Y Z2 Z1 Z1, Z2は中間点 絶対にモデルに追加

    したらダメ? 中間点を⼊れるとXからの 因果効果⾃体が ブロックされてしまうのでダメ! (これは3変量の場合と同様)
  32. 4変量以上の場合|まとめ X Y Z2 Z1 X Y X Y Z1

    Z2 Z2 Z1 X Y Z1 Z2 X Y X Y Z2 Z1 Z1 Z2 バックドアパス をブロックしろ X→Yの道を ブロックするな もうほとんどバックドア基準 細かい論点をのぞけば 畢竟, 以下2つのメッセージに集約される ▪
  33. ステップ6 | "まとめ"としてのバックドア基準 教科書内の「バックドア基準」を解読してみよう ⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤ ▪ 1. XからZの任意の要素に有向道がない 2.

    GよりXから出る⽮線(X→)を除いたグラフにおいて、 ZがXとYを有向分離する 定義 3-5 バックドア基準(back door criterion) “逆”のケース(XがYの下流)ではない ⾮巡回的有向グラフGにおいてXはYの⾮⼦孫である。このとき、次 の2条件を満たす頂点集合Zは、(X, Y)についてバックドア基準を 満たすという 例:中間変数や下流の合流点 Xの下流の共変量をモデルに加えてはいけない バックドアパスがブロックされている
  34. 4変量以上の場合|まとめ(再掲) X Y Z2 Z1 X Y X Y Z1

    Z2 Z2 Z1 X Y Z1 Z2 X Y X Y Z2 Z1 Z1 Z2 バックドアパス をブロックしろ X→Yの道を ブロックするな もうほとんどバックドア基準 ものすごい細かい論点をのぞけば 畢竟, 以下2つのメッセージに集約される ▪ 条件(1)に対応 条件(2)に対応
  35. 例題その2|どの変数を加えれば良い? X Y Z4 Z3 Z2 Z5 Z6 Z1 バックドア基準

    を満たす最⼩の 変数セットは 「Z1」 *ここでZ5, Z6を⼊れると 新たなバックドアパスが 開いてしまう *Z4はそもそも 中間点なので⼊れてはダメ Z1をブロックすると2つの バックドアパスが全て遮断される
  36. ⼀部が不明な場合|どの変数を加えれば良い? X Z1 Z2 この部分の 因果構造は不明 Y 「Z1, Z2」を加えればバックドア基準を満たす Z1,

    Z2をブロックすれば バックドアパスは 遮断される ポイントとなる部分の適切な粒度の背景知識があればよい
  37. 例題その3| どの変数を加えれば良いのか? • 構造の全てを知る必要は全くない:路線図の喩え つくば 駅 ⽴川駅 守⾕ 駅 極度に

    複雑な 鉄道網 必要なのは 「守⾕の先は⼀本線」 という"背景知識"のみ ポイントとなる部分の適切な粒度の背景知識があればよい TX
  38. 例題その3| どの変数を加えれば良いのか? 調整すべき変数の数は「処置Xを⽣じさせるシステム」と「結果 Yを⽣じさせるシステム」のデカップリングの程度に依存する (⼀般論として) X Y Z2 Z6 Z5

    Z7 Z1 Z3 Z4 Z10 Z11 Z9 Z8 バックドアパスの成因となる変数=0 いわゆる”⾃然実験”のケース Xを⽣じさせる システム Yを⽣じさせる システム 調整すべき変数の数はかなり対象と⽂脈に依存する *あと実務上はバックドアパスが閉じているかはゼロイチの話ではない
  39. 補⾜|実験における無作為化との関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 So

    many バックドアパス 実験はランダム⽣成機によりバックドアパスを閉じる ▪
  40. 補⾜|実験における無作為化との関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 コイントス

    実験は”ランダム⽣成機”によりバックドアパスを閉じる ▪
  41. 補⾜|傾向スコアとの関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 So

    many バックドアパス 傾向スコアはバックドアパスをブロックする"合成変数" ▪
  42. 補⾜ |傾向スコアとの関係 X Y Z1 Z3 Z2 Z5 Z6 Z4

    e 傾向スコアで まとめてブロック 傾向スコアはバックドアパスをブロックする"合成変数" ▪ うまく適⽤できれば超強⼒な⼿法!
  43. 補⾜ |差の差分析との関係 差の差分析は差分データ化してバックドアパスを消す ▪ X Y Z1 Z3 Z2 ΔX

    ΔY t t t t t X Y Z1 Z3 Z2 t' t' t' t' t' 時点t 時点tʼ 全要因の 時点間差分 をとる Z1, Z2, Z3が時間不変ならば ΔZ1, ΔZ2, ΔZ3はゼロ (項がキャンセルアウトされる) バックドアパス は消失
  44. I. DAGとバックドア基準のまとめ “バックドア基準が満たされている” ▪ + (2) 処理Xの下流の変数が追加されていない (1) 開きっぱなしのバックドアパスがない ≒

    変数ベースではなく”道”の開閉がキモ ▪ ・たとえ森羅万象が因果関係で繋がっていても、因 果効果を識別可能とするために考えるべき局所的 な因果構造と変数の範囲を理論的に限定できる ・傾向スコアもバックドアパスを閉じるための強⼒ な⼿法(バックドア基準は理論的条件) 介⼊効果がバイアスなく推定できる *データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です
  45. 林岳彦・⿊⽊学(2016) 「相関関係」と「因果関係」は違います。これはよく知られています。ある要 因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって,それ らのあいだに因果的な関係があるとは限りません。一方で,そのような高い相関 を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいと ころです。もしあなたの同僚やクライアントが,あなたが作成した散布図を見て

    「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。 このとき, 「この場合はこれこれこうだからこの相関関係は因果関係として解釈 できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは, それほど簡単なことではありません。こと因果関係の話になると,自分の頭の中 でその内容を整理するのも,その内容を相手に伝わるように説明するのも,なか なか難しいものです。 私たちの経験上,そんなときにとても役に立つのは,データの背後に想定して いる「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単な ポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん 出てきます]。そして,そのようなポンチ絵を描いたあとに,その描かれた因果構 造が「あ ・ る ・ 特 ・ 定 ・ の ・ 条 ・ 件 ・ 群 ・ 」を満たしているかどうかを相手と共同で検討していき ます。多くの場合,その検討を通して「この相関関係は因果関係を示していると 解釈してよいのか?」や「相関関係を因果関係として解釈するためには本来はど のようなデータが必要なのか?」といった本質的な問いについて,より明確かつ 端的な議論ができるようになります。 相関と因果と丸と矢印のはなし はじめてのバックドア基準 林岳彦(国立環境研究所)・黒木学(統計数理研究所) [特集]因果推論 現実の課題に答える統計学 参考⽂献 | バックドア基準の解説原稿 (本⽇の元ネタ) 2016年6⽉発売「岩波データサイエンスvol. 3」因果推論特集号
  46. 参考⽂献 | 社会学者向け v IL Morgan and Winship (2014) 『Counterfactuals

    and Causal Inference: Methods and Principles for Social Research』 (2nd ed.) DAGと潜在結果モデル のhybrid
  47. 1. 構造から⾒た統計的因果推論 :DAGとバックドア基準の⼊⾨ 2. 差分から⾒た統計的因果推論 :潜在結果モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へ パートIの⽬次 0. 序:因果と相関と「対象の多様なありよう」
  48. I. 解題 パートI:「構造」と「差分」の視点の統合 「対象を理解すること」にとって 統計的因果推論とは何か? ⾮巡回有向グラフ(DAG) 潜在結果モデル 構造的因果モデル 𝒀 =

    𝑿𝒀𝟏 + (𝟏 − 𝑿)𝒀𝟎 X Y Z1 Z2 Z3 Average Causal Effect = 𝑬[𝒀𝟏] − 𝑬[𝒀𝟎] 𝑋: = 𝑔: 𝑝𝑎 𝑋: , 𝜀: 𝑖 = 1, … , 𝑝 「差異からみた因果」 「構造からみた因果」
  49. I. 解題 パートI:「構造」と「差分」の視点の統合 「対象を理解すること」にとって 統計的因果推論とは何か? ⾮巡回有向グラフ(DAG) 潜在結果モデル 構造的因果モデル 𝒀 =

    𝑿𝒀𝟏 + (𝟏 − 𝑿)𝒀𝟎 X Y Z1 Z2 Z3 Average Causal Effect = 𝑬[𝒀𝟏] − 𝑬[𝒀𝟎] 𝑋: = 𝑔: 𝑝𝑎 𝑋: , 𝜀: 𝑖 = 1, … , 𝑝 「差異からみた因果」 「構造からみた因果」
  50. まず、個体レベルの因果効果を考える • 猫のノミの投薬治療の仮想例で考えていきます ノミに感染している猫へのノミ駆除剤の効果の例 ぴかそ 「駆除剤なし」 をX=なし、「駆除剤あり」 をX=ありとする 投薬により駆除までの⽇数Yを短くできるか? ・

    ・ “ぴかそ”における駆除剤の投薬の因果効果を 以下のように定義する “ぴかそ”に投薬した場合(X=1)の「ノミの駆除までの⽇数Y」 - “ぴかそ”に投薬しない場合(X=0)の「ノミの駆除までの⽇数Y」 たとえば投薬しない場合Y=14⽇、投薬した場合Y=4⽇なら、 投薬の因果効果は「-10⽇」となる
  51. まず、個体レベルの因果効果を考える この差(-10⽇)が 個体の因果効果の定義 ぴかそ 投薬 ⽇数Y 14⽇ 4⽇ ॲཧT ݸମiͷ

    ൓ԠYi ͳ͠ ͋Γ • 実はこの因果効果の値を観測することは不可能である “ぴかそ”に投薬した場合(X=あり)の「ノミの駆除までの⽇数Y」 - “ぴかそ”に投薬しない場合(X=なし)の「ノミの駆除までの⽇数Y」 X
  52. 集団レベルの因果効果を考える ॲཧT ݸମiͷ ൓ԠYi ͳ͠ ͋Γ " # $ %

    & ' " # $ % & ' この差が 集団Aへの因果効果の定義 個体A, B, C, D, E, Fからなる集団Aへの平均効果を考える • 個体ではなくて集団なら”根本問題”を回避できる? 集団Aに投薬した場合(X=あり)の「ノミの駆除までの平均⽇数Y」 - 集団Aに投薬しない場合(X=なし)の「ノミの駆除までの平均⽇数Y」 X
  53. 集団レベルの因果効果を考える • 個体ではなくて集団なら”根本問題”を回避できる? 集団Aに投薬した場合(X=あり)の「ノミの駆除までの平均⽇数Y」 - 集団Aに投薬しない場合(X=なし)の「ノミの駆除までの平均⽇数Y」 実際の処理では各個体にどちらか特定の処理を割り付けることなる 投薬なしのグループ(個体C, D, E)

    投薬ありのグループ(個体A, B, D) ॲཧT ݸମiͷ ൓ԠYi ͳ͠ ͋Γ ॲཧT ͳ͠ ͋Γ " # $ % & ' " # $ % & ' " # $ % & ' " # $ % & ' " # $ % & ' 本来の因果効果 観察された 処理群間の差 各処理グループに含まれる個体は同⼀ではない →集団への因果効果も原理的に観測できない X X
  54. 集団レベルの因果効果を考える • サブグループに分ければ”根本問題”を回避できる? 集団A1に投薬した場合(X=あり)の「ノミの駆除までの平均⽇数Y」 - 集団A2に投薬しない場合(X=なし)の「ノミの駆除までの平均⽇数Y」 集団A 投薬なし(X=なし)のサブグループ (集団A1) 投薬あり(X=あり)のサブグループ

    (集団A2) ではどうしたら良いか? 平均⽇数Yを観測 平均⽇数Yを観測 この差は観測可能であるが サブグループ間での「投薬の有無による差」と「背景因⼦の差」 が混ざってしまっていて区別がつかない 状況を潜在反応モデルで 整理してみよう
  55. 潜在結果モデルという枠組み • 処置(投薬)×反応(⽇数)の組合せを整理してみる X=無のサブグループ X=有のサブグループ もしX=無 のときの 反応 (i)の「駆除までの⽇数」 (ii)の「駆除までの⽇数」

    もしX=有 のときの 反応 (iii)の「駆除までの⽇数」 (iv)の「駆除までの⽇数」 @現実世界 @反事実的可能世界 @反事実的可能世界 @反事実的可能世界 因果推論とは での反応と @現実世界 観測可能な での反応の「差」の計算 @現実世界 観測不可能な @反事実的可能世界 の世界も扱える枠組みがほしい!
  56. 潜在結果モデルという枠組み • Rubinの潜在結果モデルの考え⽅ 処理Tに対して、各個体𝑖は⼀意な(決定論的に定まる) 潜在結果𝑌(𝑖)!"($)をもつ 𝒀(ぴかそ)𝐢𝐟(𝑿% ) ぴかそ だり もしも「ぴかそ」が

    「駆除剤あり」のときの 「⽇数」の潜在反応 ノミに感染している猫へのノミ駆除剤の効果の例 「駆除剤なし」 をX=無、「駆除剤あり」 をX=有、「駆除までの⽇数」をYとする 𝒀(だり)𝐢𝐟(𝑿% ) もしも「だり」が 「駆除剤なし」のときの 「⽇数」の潜在反応 有 無 *このifを明⽰する表記法は⼀般的ではないが 分かりやすさ優先して本⽇はこれを使⽤
  57. 潜在結果モデルという枠組み • このモデルの何が嬉しいかと⾔うと、因果効果を 「処理群間での潜在反応の差」として定式化できる 潜在結果を⽤いた「ぴかそ」への投薬の因果効果の定義 𝒀 ぴかそ 𝐢𝐟(𝑿% ) −

    𝒀 ぴかそ 𝐢𝐟(𝑿% ) ぴかそ 現実世界内ではこの両者を同時に観測できない “因果推論の根本問題” 同じ個体に同時に異なる処理はできない 有 無 *猫の名前が「しゅれーでぃんがー」の場合は別途要検討
  58. ࣮ࡍͷॲஔT જࡏ൓Ԡ   Y(i) if(T=0) if(T=1) Y(i) if(T) Y

    潜在結果モデルという枠組み • 潜在モデルの枠組みを⽤いると、”因果推論の根本 問題”を「⽋測」の枠組みで捉えることができる Y (i)if(T=0) if(T=1) ɿݸମi ʹॲཧT=0Λ༩͑ͨͱ͖ͷજࡏ൓Ԡ ɿݸମi ʹॲཧT =1Λ༩͑ͨͱ͖ͷજࡏ൓Ԡ Y (i) if(T=1) Y (i) Y (i)if(T=0) - ݸମJʹ͓͚ΔҼՌޮՌͷఆٛɿ この差が個体iの 因果効果の定義 ぴかそ 投薬 駆除までの⽇数 “⽋測” “⽋測” _ _ / 有 無 有 無 有 無 有 無 X X X X X X X X X X 結果 有 無
  59. 潜在結果モデルという枠組み • 何を知る必要があるのかを潜在反応モデルの枠組み でもういちど整理してみる 計算したいのは(たとえば)因果効果 (iv) – (ii) Average Treatment

    Effect of the Treated (ATT) X=無のサブグループ X=有のサブグループ X=無の 潜在反応 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] X=有の 潜在反応 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) けれども、(ii)は反事実なので観測&計算できない! 反事実項の値を知るにはどうすればよい? 無 無 有 有 無 無 有 有
  60. 潜在結果モデルからみる無作為化 • 解決策:無作為化により反事実項を観察項で代替 X=無のサブグループ X=有のサブグループ X=無の 潜在反応 𝑬[𝒀 集団𝑨|𝑿 =

    𝟎 𝐢𝐟(𝑿)𝟎)] 𝑬[𝒀 集団𝑨|𝑿 = 𝟏 𝐢𝐟(𝑿)𝟎)] X=有の 潜在反応 𝑬[𝒀 集団𝑨|𝑿 = 𝟎 𝐢𝐟(𝑿)𝟏)] 𝑬[𝒀 集団𝑨|𝑿 = 𝟏 𝐢𝐟(𝑿)𝟏)] そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) サンプル集団 処理を無作為に割付 因果効果 (iv) – (ii) を (iv) – (i) として計算可能 無作為割付→サブグループの間で背景因⼦が揃うと期待できる = 反事実である(ii)を観察可能な(i)で代替可能 「同じ集団」ではないが「⼗分に似た集団」として =
  61. 潜在結果モデルから⾒る無作為化 • 同じこと違う表現でもういちど説明すると: 𝑬[𝒀 集団𝑨 𝐢𝐟(𝑿A𝟏)] − 𝑬[𝒀(集団𝑨) 𝐢𝐟(𝑿A𝟎)] 同⼀の集団に異なる処理を与えることはできない

    𝑬[𝒀 集団𝑨 𝐢𝐟 𝑿)𝟏 |𝑿 = 𝟏] − 𝑬[𝒀(集団𝑨) 𝐢𝐟 𝑿)𝟎 |𝑿 = 𝟎] 無作為に(たとえばコイン投げで)処理Tを割り付ける 潜在反応モデルによる集団Aへの因果効果の定義 「同⼀ではないけど⼗分に背景が揃っている集団」に 「異なる処理X=0/X=1」を与えることができる =因果効果の定義に⼗分に近い値を推定できると期待できる
  62. 補⾜|傾向スコア法 X=0を受けた群 X=1を受けた群 X=0の潜 在反応 𝑬[𝒀𝟎 ねこ集団𝑨|𝑿 = 𝟎 ]

    𝑬[𝒀𝟎 ねこ集団𝑨|𝑿 = 𝟏 ] X=1の潜 在反応 𝑬[𝒀𝟏 ねこ集団𝑨|𝑿 = 𝟎 ] 𝑬[𝒀𝟏 ねこ集団𝑨|𝑿 = 𝟏 ] 共変量 の分布 そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) = = 潜在反応と処理Xが条件付き独⽴→ 𝑌'(()) 𝑋 | 𝑒 ⊥ ⊥ eでマッチング・重みづけ 傾向スコアe 共変量 両群での共変量の分布のインバランスをpost-hocに補正するための バランシングスコアeを共変量から計算する 因果効果 (iv) – (ii) を (iv) – (i) として計算可能 条件付き無視 可能性条件
  63. の条件を満たすことで、観察値 に基づき「反事実」の項も計算可能 (尚、バックドア基準を満たせば上記条件は満たされる) 潜在反応モデルと関数的因果モデル| Rubinの潜在結果モデルの特徴(まとめ) 因果効果を「異なる処理に対する潜在結果の 差分」として定義する 因果効果の定義式には「反事実」の項が含まれる 𝑌!"($) 𝑋|𝑍

    ⊥ ⊥ 潜在反応の中⾝(”why it works”)はブラック ボックスでも構わない *潜在反応がブラックボックスであるのは理論的 な必然というわけではない(次の話につづく) 尚、処理Xが連続量のときの 表現が苦⼿という側⾯もある 中⾝に関わらず適⽤できるので 「推定プロトコル」への⾒通しがよい たとえばRCTとか傾向スコアなどで
  64. 1. 構造から⾒た統計的因果推論 :DAGとバックドア基準の⼊⾨ 2. 差分から⾒た統計的因果推論 :潜在結果モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在結果モデルのSCMによる表現 (3) 潜在結果モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へ パートIの⽬次 0. 序:因果と相関と「対象の多様なありよう」
  65. 因果グラフと関数的因果モデル| 構造的因果モデルSCM(a.k.a.関数因果モデル)とは 因果構造を関数の親⼦関係の連なりの形で記述したもの 関数因果モデルのフォーマルな定義 ⾮巡回的有向グラフGとその頂点に対応する確率変数の集合V = {X1,…Xp} が与えられている.グラフGが確率変数間の関数関係を ⿊⽊(2017), p70より引⽤

    になる形に規定し、確率変数がこの関数関係にしたがって⾃律的でかつ 定常的に⽣成されるとき、Gを因果ダイアグラムという.ここに、錯乱 項ε1,…,εpは互いに独⽴であるとする.また、pa(Xi)は因果ダイアグラムG におけるXiの親全体からなる変数集合であり、GにおけるXiの直接的原因 (direct cause)と解釈される. 上式を広い意味で物理的なデータ⽣成過程のモデルとして捉えるとき、上式は 関数因果モデルあるいは、構造⽅程式モデル、構造的因果モデルと呼ばれる. 𝑋! = 𝑔! 𝑝𝑎 𝑋! , 𝜀! 𝑖 = 1, … , 𝑝 これは等式というより代⼊式 ベイジアンネットワークとは異なり「因果」概念を内包する Structural Causal Model
  66. 因果グラフと関数的因果モデル| 構造的因果モデル(SCM)とは 因果ダイアグラムはSCMの視覚的表現といえる (実は後者の⽅が表現できるものの幅は広い) 因果構造を関数の親⼦関係で記述したもの GUIとCUIのようなイメージ(CUIが本体) Y X Z1 Z2

    Z3 特定の関数型を特に 念頭に置く話ではない 𝑌 = 𝑔" (𝑋, 𝑍1) 𝑋 = 𝑔# (𝑍2, 𝑍3) 𝑍1 = 𝑔$% (𝑍2) 𝑌 = ℎ" (𝑍2, 𝑍3) 実は「Pearlの体系=グラフィカルモデル」と いうのは適切な理解ではない! こうも書けるし このように 外⽣変数の関数 としても書ける 詳細は⿊⽊(2017) (錯乱項は省略)
  67. 1. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ 2. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へ パートIの⽬次
  68. 潜在反応モデルと関数的因果モデル| 潜在結果モデルを関数的因果モデルで表現する 𝑌'(())(ぴかそ) = 𝑓(𝑖𝑓(𝑋), 𝑍1, 𝑍2, 𝑍3, . .

    , 𝑍𝑛) 「ぴかそ」の特性を表す全変数 𝑌'(()%*)(ぴかそ) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, . . , 𝑍𝑛) 𝑌'(()%+)(ぴかそ) = 𝑓(𝑋 = 1, 𝑍1, 𝑍2, . . , 𝑍𝑛) 潜在結果の”中⾝”を関数𝑓と変数𝑍で表現している ぴかそ 潜在結果は概念的にはその個体がもつ 諸特性の決定論的関数で表現できる 𝑖𝑓 𝑋 = 0, 𝑖𝑓 𝑋 = 1, 潜在結果の脱ブラックボックス化 SUTVA条件のより明⽰的な検討へ繋がる→パート2へ
  69. 潜在反応モデルと関数的因果モデル| 例えば全特性が近似的に等しい個体がいれば… 𝑌'(()%*)(たつや) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, 𝑍3,

    . . , 𝑍𝑛) 𝑌'(()%*)(かずや) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛) もし「たつや」「かずや」という双⼦がいて もし関数𝑓および変数𝑍が近似的に等しければ 𝑌#$(&'() たつや − 𝑌#$(&'*) たつや ≒ 𝑌#$(&'() たつや − 𝑌#$(&'*) かずや これは観測可能! 「関数𝑓と特性𝑍」から識別可能性(バイアスの ない因果効果の推定が可能か)を議論しうる 観測不可能な因果効果 少数事例研究がやってることはこれに近い?
  70. 潜在反応モデルと関数因果モデルと因果グラフ| 集団Aへの平均因果効果を考える 𝐸[𝑌'(())(集団𝐴)] = 𝐸[𝑓(𝑖𝑓(𝑋), 𝑍1, 𝑍2, . . .

    , 𝑍𝑛)] 平均因果効果=𝐸[𝑌,-($).) ねこ集団𝐴 − 𝐸[𝑌,-($)/) ねこ集団𝐴 ] = 𝐸[𝑌,-($).) ねこ集団𝐴|𝑋 = 1 ] − 𝐸[𝑌,-($)/) ねこ集団𝐴|𝑋 = 0 ] 𝐸[𝑌:C(DA=) 集団𝐴|𝑋 = 1 ] = 𝐸[𝑓 𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛 𝑋 = 1 ] 𝐸[𝑌:C(DAE) 集団𝐴|𝑋 = 0 ] = 𝐸[𝑓(𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛|𝑋 = 0)] もし異なる処理Xを受けたサンプル集団間で 関数fおよび特性Zの分布が同等とみなせる場合 異なる処理を受けた集団間で 潜在反応の分布が異ならない 観測値から因果効果を計算可能
  71. 潜在反応モデルと関数因果モデルと因果グラフ| 「集団間(もしくは個体間)での 関数fおよび特性Zの分布の同等性」 構造的 類似性 特性的 類似性 ⼀般に:潜在結果の類似性を決める⼆つの要素 𝑌'(()%,) 集団𝐴

    = 𝑓(𝑖𝑓(𝑋 = 𝑥), 𝑍1, 𝑍2, . . , 𝑍𝑛) 𝑌'(()%,) 集団𝐵 = 𝑓(𝑖𝑓(𝑋 = 𝑥), 𝑍1, 𝑍2, . . , 𝑍𝑛) 両者が⼗分に近ければ集団Aの結果を集団Bの結果で代替できる (と⼀般に解釈される)
  72. 1. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ 2. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へ パートIの⽬次
  73. 潜在反応モデルと関数因果モデルと因果グラフ| 潜在反応モデルをDAGで表現してみると 畢竟、潜在反応モデルと関数因果モデルと バックドア基準の話はシームレスに繋がっている Y X Z1 Z2 Z3 バックドア基準に基づき、たとえばこの潜在反応モデ

    ルの例で調整する必要があるのはZ1だけ 潜在反応に実際のXの値が与えられて観測値Yとなる 𝑌'(()) 𝑌 = 𝑓 𝑌,-($), 𝑋 = 𝑋𝑌,-($).) + (1 − 𝑋)𝑌,-($)/) たとえばXが0/1のときはこう書ける 𝑌#$(&) = 𝑓(𝑖𝑓 𝑋 , 𝑍1, 𝑍3) 𝑌:C(D) 𝑋|𝑍1 ⊥ ⊥ 条件付き無視可能性
  74. 本⽇の内容 I. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1)

    因果グラフのSCMによる表現 (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ
  75. Y X Z1 Z2 Z3 𝑌 = 𝑔" (𝑋, 𝑍1)

    𝑋 = 𝑔# (𝑍2, 𝑍3) 𝑍1 = 𝑔$% (𝑍2) 𝑌 = ℎ" (𝑍2, 𝑍3) こうも書けるし こうも書ける (1) 構造的因果モデルから帰納的/演繹的因果 推論の全体を⾒る 構造的因果モデルは⾮常に広いクラスのモデルを含む
  76. 構造的因果モデルから帰納的/演繹的因果推論の全体を⾒る 𝑌 = ℎ" (𝑍2, 𝑍3) こうも書ける この形、⾮常に⼀般的である 𝑇𝐸𝑀𝑃 =

    𝑚𝑎𝑖𝑛 (モデルパラメータベクトル) たとえばスパコンで回すような気候変動シミュレー ションモデル(What if/反事実的計算に⽤いられる)もこんな 形で書きうる 構造的因果モデルは⾮常に広いクラスのモデルを含む
  77. 潜在反応 モデル メカニズムが ブラックボックス であるたぐいの 物理シミュレー ションモデル 因果効果推定アプローチの連続的な理論観(私⾒) 中間変数を介 す2段階回帰

    under フロントドア 基準 構造推定@ 経済学 X以外の共変量を バランシングして いくたぐいの 𝑌 = 𝑓 (処理𝑋, 外⽣変数𝑧) 重回帰 under バックドア 基準 RCT, 準実験 例えばスパコンで回す ような気候変動モデル 関数fと変数zについての モデル式の正当性に依存しない ただし、関数fと変数zの理論が なければ移設可能性の把握が困難 関数fと変数zについての モデル式の正当性に依存する 関数fと変数zの同等性の検討 により移設可能性を議論可能 祖先変数を介 す操作変数・ ⼆段階SLS 構造的因果モデルから帰納的/演繹的因果推論の全体を⾒る Full-of-Model Model-free X→Yの祖先-⼦孫 系列の効果伝搬を 演繹計算・集計し ていくたぐいの
  78. (2) 「Issueの総合的理解」における因果推論 ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔ 例:有機⽔銀汚染に対する環境リスク研究者の"頭の中” ޻৔Ͱͷ ੜ࢈աఔ

    ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ “Issue/problem-driven”の解析者と、”Method- driven”の解析者の”頭の中”は異なる Issue-drivenの解析者の 多くは常に頭の中に 何らかの "因果モデル"をもつ
  79. (2) 「Issueの総合的理解」における因果推論 150 どこに介⼊しうるのか/もし介⼊したらどうなるのかについてのアイデ アが常に頭の中をぐるぐるしている ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔

    ޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ ⼯場の⽣産過程を 変えれば有機⽔銀 の⽣成を抑えられ るのでは? 排⽔処理を変えれ ば有機⽔銀を除去 できるのでは? 禁漁により⼈への 曝露を防げるのは? 浚渫により汚染を 低減できるので は? 市場への流通を⽌めれば 市⺠への曝露は防げるのでは? 妊婦や⼦供などへの注意喚起により ハイリスクグループへの曝露を減ら せるのでは? 市場への流通を⽌める と⾃家消費により曝露 が増えるかも? 例:有機⽔銀汚染に対する環境リスク研究者の"頭の中”
  80. 「差異」と「構造」の繋がりが⾒えないと・・ 151 • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は? 頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔

    ޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ (政策的対応を念頭においた) 介⼊効果推定 市場= 流通禁⽌ 市場= 流通あり 市⺠の 健康 市⺠の 健康 ここの差分 =介⼊効果 どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう
  81. 「差異」と「構造」の繋がりが⾒えないと・・ 152 • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は? 頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔

    ޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ (政策的対応を念頭においた) 介⼊効果推定 市場= 流通禁⽌ 市場= 流通あり 市⺠の 健康 市⺠の 健康 ここの差分 =介⼊効果 どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう
  82. 153 両者にピントを合わせて思考できるようになってくる 頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔ ޻৔Ͱͷ ੜ࢈աఔ

    ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ (政策的規制措置等を念頭においた) 介⼊効果推定 do(市場= 流通禁⽌) do(市場= 流通あり) 市⺠の 健康 市⺠の 健康 ここの差分 =介⼊効果 両者の関係が⾒えるぞ・・・! 「差異」と「構造」の繋がりが⾒えてくると・・・
  83. 変数を概念的に吟味するとはどういうことか| 統計的因果推論と諸研究の関連性のイメージ 因果 モデル 関数fと変数Zのあり よう⾃体を分析対象 とした質的/量的研究 介⼊効果 推定 統計的

    因果推論 分析概念の/関数fと変数Zの モデルの⾼解像度化 バイアスの減少 Target/SUTVAの明確化 深化 効果の定量的な実証 量的な重要度の明確化 介⼊効果がいかに/どの程度⽣じるかについての “Sufficiently deep explanation”を社会に提供できる Morgan and Winship (2014) 「差がありました」の先の 「どうすればいいの?」に答えたい! 例えば、個別ケースのプロセストレーシング
  84. 変数を概念的に吟味するとはどういうことか| 統計的因果推論で因果グラフを⽤いることの効⽤ ・ 調整すべき変数についての論理が得られる ・ 量的(統計的)研究と質的研究の橋渡しとなりうる ・ 調整すべき変数を絞り込むことができる ・ 感度分析・媒介効果分析への橋渡しとなりうる

    ・ 調整すべき変数の抜け漏れを防げる ・ 因果の図解⾃体が関係者とのやりとりに役⽴つ ・ 移設可能性についての議論も深まりやすくなる(移設可能性は⽣ 成メカニズムの安定性や類似性にも⼤きく依存するため) ・ 識別可能性の前提条件の成⽴を検証するための視覚化 “Assumptions visualization tool” ・ 結果・処理・共変量の変数の概念的妥当性の吟味に役⽴つ “Issueの総合的理解”への⾒通しが開きやすい
  85. 導⼊|統計的推測の主要な3⽬的(再掲) ⽬的の 分類 やりたいことの内容 事例のイメージ (⼤学の留年の例で) 理念的な理想をなす 解析法のイメージ しばしば 現実的な

    解析法 予測 現在得られている情報 から、将来/未知の値 /状況を予測したい (要因への介⼊は伴わない場合) 多数の変数の情報から、留年 リスクの⾼い学⽣を⾒つけた い(→その後⽀援につなげる など) 機械学習 回帰分析! 説明 要素間の関連性を説明 したい なぜ学⽣が留年するかを説明 したい(要因を探索し理解/ 対策につなげたい) フルスタックの 構造⽅程式 (含む因⼦分析等) 回帰分析! 因果/介⼊ 効果の推定 ある特定の要因に介⼊ したときの、ある特定 の要因への効果を知り たい 特定のプログラムの導⼊が留 年を防⽌する効果を知りたい ランダム化⽐較試験 回帰分析! ⼀⾒同じ「回帰分析」でも、⽬的に応じて係数の 解釈のあり⽅も、重要となる仮定群も異なる (異論は認める) * *互いに排反な分類という意味ではないので注意 ↑ パート1では「因果効果の推定」が主テーマ ▪
  86. 導⼊|統計的推測の主要な3⽬的(再掲) ⽬的の 分類 やりたいことの内容 事例のイメージ (⼤学の留年の例で) 理念的な理想をなす 解析法のイメージ しばしば 現実的な

    解析法 予測 現在得られている情報 から、将来/未知の値 /状況を予測したい (要因への介⼊は伴わない場合) 多数の変数の情報から、留年 リスクの⾼い学⽣を⾒つけた い(→その後⽀援につなげる など) 機械学習 回帰分析! 説明 要素間の関連性を説明 したい なぜ学⽣が留年するかを説明 したい(要因を探索し理解/ 対策につなげたい) フルスタックの 構造⽅程式 (含む因⼦分析等) 回帰分析! 因果/介⼊ 効果の推定 ある特定の要因に介⼊ したときの、ある特定 の要因への効果を知り たい 特定のプログラムの導⼊が留 年を防⽌する効果を知りたい ランダム化⽐較試験 回帰分析! ⼀⾒同じ「回帰分析」でも、⽬的に応じて係数の 解釈のあり⽅も、重要となる仮定群も異なる (異論は認める) * *互いに排反な分類という意味ではないので注意 ↑ パート1では「因果効果の推定」が主テーマ ▪ 構造的因果モデルはこれらの⽅向性の 異なる世界線を架橋しうる点が嬉しい
  87. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  88. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  89. 2. そのXは本当にXか:概念的妥当性を吟味する 3. その因果効果はどこまで”拡⼤解釈”できるか パートIIの⽬次 ・ その1:媒介経路の観点から ・ その2:要因間の依存性の観点から ・

    その3:⽂脈依存性の観点から ・ その4:測定の観点から ・ ターゲット妥当性の分解 1. 可能世界への”チャネル”としてのSUTVA条件 ・ 事例:壊⾎病と”シトラス” ・ 事例:マシュマロテストの”拡⼤解釈”
  90. 2. そのXは本当にXか:概念的妥当性を吟味する 3. その因果効果はどこまで”拡⼤解釈”できるか パートIIの⽬次 ・ その1:媒介経路の観点から ・ その2:要因間の依存性の観点から ・

    その3:⽂脈依存性の観点から ・ その4:測定の観点から ・ ターゲット妥当性の分解 1. 可能世界への”チャネル”としてのSUTVA条件 ・ 事例:壊⾎病と”シトラス” ・ 事例:マシュマロテストの”拡⼤解釈”
  91. SUTVA条件とは SUTVA条件の定義 個体 i を特徴づける潜在的な結果{Yi(1), Yi(0)}が次の2条件を満⾜するとき、 それはSUTVA(Stable Unit Treatment Value

    Assumption)条件を満⾜する という 岩崎学『統計的因果推論』, p78より引⽤ (表記法を⼀部編集) ▪ Rubinの潜在結果モデルでの因果効果の定義 はSUTVA条件を前提とする (a) 個体 i の潜在的な結果は、他の個体の受ける処置に依存しない (b) 個体 i に対する処置は1通りに定まる 潜在結果を⽤いた「ぴかそ」への投薬Xの因果効果の定義 𝒀 ぴかそ 𝐢𝐟(𝑿% ) − 𝒀 ぴかそ 𝐢𝐟(𝑿% ) 有 無 Stable Unit Treatment Value Assumption
  92. (hidden versionsがあると) SUTVA条件にあてはまらない SUTVA条件とは ▪ 「個体 i に対する処置は1通りに定まる」とは? (no hidden

    version of treatment) “処置=ワクチン接種” アストラゼネカ? モデルナ? “処置”を明確に定義できないので 因果効果がill-definedになる シノファーム? スプートニクV? ファイザー?
  93. SUTVA条件とは ▪ なぜSUTVA条件が重要なのか? 個体i@反事実世界A どの反事実世界との コントラストを取れば良い? 内部機構を⼀切もたないRubinの潜在結果モデルの枠組み では、ある特定の可能世界とのコントラストを取ること (なぜこの世界がその可能世界と接続されるのか)を正当 化する内在的な論理がない

    (観測不可能) 個体i@この世界 (観測可能) 𝒀 𝒊 個体i@反事実世界B 個体i@反事実世界C 個体i@反事実世界D 3ヶ⽉⽔を誰もやらず、花が枯れた世界 林が⽔を毎⽇あげた世界? or 林が⽔を⽉⼀であげた世界? orトランプが毎⽇来⽇して⽔をあげた世界?
  94. SUTVA条件とは ▪ “まずSTUVAあれ!” 個体i@この世界 (観測不可能) “処置X”という チャネルが ⼀意に定まる ことで 特定の可能世界との

    接続がdefineされる Stable Unit Treatment Value 𝒀 𝒊 𝐢𝐟(𝑿) 「なぜ」とかじゃなくて 個体i@反事実世界A 個体i@反事実世界B 個体i@反事実世界C 個体i@反事実世界D (観測可能) 𝒀 𝒊 ⽔がなく、花が枯れた世界 X = 林が週⼀で⽔をあげる 林が⽔を週⼀で⽔をあげた世界 Rubinの潜在結果モデルではSUTVAが基底的な (それ以上その体系内では深掘りできない) 仮定として要請される
  95. 2. そのXは本当にXか:概念的妥当性を吟味する 3. その因果効果はどこまで”拡⼤解釈”できるか パートIIの⽬次 ・ その1:媒介経路の観点から ・ その2:要因間の依存性の観点から ・

    その3:⽂脈依存性の観点から ・ その4:測定の観点から ・ ターゲット妥当性の分解 1. 可能世界への”チャネル”としてのSUTVA条件 ・ 事例:壊⾎病と”シトラス” ・ 事例:マシュマロテストの”拡⼤解釈”
  96. 概念の”質的”吟味:媒介経路の観点から ▪ ॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ ෰ༀͷ༗ແ ෰ༀʹΑΔ ඃݧऀͷ

    ৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 統合: 処⽅X→健康指標Yの「より”厚い”記述」 ແ࡞ҝׂ෇͞Εͨॲํ9ͷޮՌ͸ɺશͯͷ ഔհܦ࿏Λ૯߹ͨ͠஋Ͱ͋Δʢ㱠ༀཧޮՌͰ͸ͳ͍ʂʣ
  97. 概念の”質的”吟味:媒介経路の観点から ▪ ِༀPSຊༀ ͷॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ ෰ༀͷ༗ແ ෰ༀʹΑΔ

    ඃݧऀͷ ৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 薬理作⽤の因果効果を知るには?
  98. 概念の”質的”吟味:媒介経路の観点から ▪ ِༀPSຊༀ ͷॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ ෰ༀͷ༗ແ ෰ༀʹΑΔ

    ඃݧऀͷ ৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 薬理作⽤の因果効果を知るには? શһ෰ༀ ९कͷపఈ ϒϥΠϯυʹΑΔ੾அ ϒϥΠϯυ ʹΑΔ੾அ
  99. 概念の”質的”吟味:媒介経路の観点から ▪ ِༀPSຊༀ ͷॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ ෰ༀͷ༗ແ ෰ༀʹΑΔ

    ඃݧऀͷ ৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 薬理作⽤の因果効果を知るには? શһ෰ༀ ९कͷపఈ ղܾ๏ɿೋॏ໡ݕ๏ʴ९कͷపఈ
  100. 概念の”質的”吟味:媒介経路の観点から 処置(処⽅)の概念的吟味で何が変わったか? ▪ 最初は薬Aの影響を⾒る際に、無作為化された「薬の処⽅の有無」が 「健康指標」に影響する単純な図式で捉えていた →「処⽅」が健康に与える影響が何に媒介されうるかを質的な知識に基 づき吟味した →「処⽅」の概念的意味がより⾼い解像度で理解された →「処⽅の因果効果」は「薬Aの⽣理的作⽤による因果効果」と同義でな いことが明⽰化された

    →「薬の⽣理的作⽤による効果」以外の経路を遮断するという実験デザ インの必要性が理解された →「本当に知りたい因果効果」にフォーカスするための具体的なデータ 取得プロトコル(⼆重盲検法)が検討された 「処理」概念と媒介経路の吟味により、因果効果の 推定・解釈がより適切に実施できるようになった (質的知⾒による概念の吟味は重要)
  101. SUTVAを考える:要因間の依存性の観点から 効果の修飾:集団内での特性に応じて効果が異なる ▪ ༀ.ͷ ෰ༀ9 ࣬ױ,ͷ ࢦඪ: Φεೣ ༀ.ͷ ෰ༀ9

    ࣬ױ,ͷ ࢦඪ: ϝεೣ ૚ผʹղੳͯ͠ΈΔͱɾɾɾ  ʮ9ˠ:ͷฏۉҼՌޮՌʯ͸ʮ9ˠ:ͷҼՌޮՌʯͷ͋ΓΑ͏Λ ͏·͘൓ө͍ͯ͠ͳ͍ʢz9ͷҼՌޮՌzͷ֓೦త༳Εʣ ͦ΋ͦ΋Φεೣʹ͓͚Δʮ࣬ױ,ʯͱϝεೣʹ͓͚Δʮ࣬ױ,ʯ͸ ྨࣅͷපଶΛ΋ͭผͷ࣬ױ͔΋ʁʢҼՌਪ࿦ˠ࣭త֓೦΁ͷϑΟʔυόοΫʣ ˎԾ૝ͷྫͰ͢
  102. SUTVAを考える:⽂脈依存性の観点から 処置の⽂脈依存性の存在 ▪ 服薬Xの因果効果 =𝑌'( )% だだ − 𝑌'( )%

    だだ これ、断薬の⽂脈でも同じ値になる? 服薬あり 服薬なし ʮ9ˠ:ͷҼՌޮՌʯ͸ॲஔ9ͷจ຺ʹ΋ґଘ͢Δ 他の例だと例えば、同じ教育プログラムのRCTでも、⾃発的参加と、 謝⾦による参加と、強制参加の場合の処置効果は異なる場合など SUTVA条件により潜在結果は⼀義的な値を取ることが想定されているが、 0→1の効果と、1→0の効果は同じとは限らない
  103. 因果推論と「質的な研究」| 概念吟味の重要性の歴史的な例(壊⾎病) 1747年 対照実験によりシトラスが船員の壊⾎病を防ぐ 効果が確認 シトラス→”酸味”→壊⾎病(の防⽌) Pearl and Mackenzie (2018)の記述に基づく

    1800’s 英国海軍ではシトラス積載により壊⾎病は過去 のものに しかしmediatorの取り違えにより悲劇が・・・ シトラス→レモン→ライム→加熱濃縮ライムジュース へと代替されていった(代替のたびにビタミンが減っていく・・) 1900年前後の極地探検にて壊⾎病による死者が多発 本当のmediatorはビタミンC 柑橘の効果⾃体が疑問視され無視されるように・・ ▪
  104. 因果推論と「質的な研究」| Pearl and Mackenzie (2018)の記述に基づく シトラス→”酸味”→壊⾎病(の防⽌) しかしmediatorの取り違えにより悲劇が・・・ シトラス→レモン→ライム→加熱濃縮ライムジュース へと代替されていった(代替のたびにビタミンが減っていく・・) 現実の系において”処置”の同⼀性の担保は必ずし

    も簡単な話ではない e.g., RCTが⾏われた”意識の⾼い”学校と同⼀の ”処置”を普通の学校で実現できるのか? 異なる対象/⽂脈における“処置”の同⼀性の担保 は質的な理解度に依存する 概念吟味の重要性の歴史的な例(壊⾎病) ▪
  105. II.2 概念の吟味の⼩まとめ Rubinの因果モデルはSUTVA条件を所与の前提とす ることで、理論的な定義と解析プロトコルの⾒通し を明確にしている ⼀⽅、現実の系では(hidden) multiple versionsが あることは普通である、あるいは、 概念の”厚い”記述への志向はSUTVA条件の成⽴の

    難しさを明らかにしがち →この話は第IV部へつづく IV. さて、われわれは何を知りたいのか? 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  106. 2. そのXは本当にXか:概念的妥当性を吟味する 3. その因果効果はどこまで”拡⼤解釈”できるか パートIIの⽬次 ・ その1:媒介経路の観点から ・ その2:要因間の依存性の観点から ・

    その3:⽂脈依存性の観点から ・ その4:測定の観点から ・ ターゲット妥当性の分解 1. 可能世界への”チャネル”としてのSUTVA条件
  107. 解釈の”質的”吟味:ターゲット妥当性の分解 「サンプル集団」と「ターゲット集団」の関係の類型 ▪ (A) サンプル元集団が ターゲット集団 (B) サンプル元集団の 中の⼀部の特性をもっ たサブ集団がターゲッ

    ト集団 (C) サンプル元集団と は異なる集団が ターゲット集団 サンプル元集団 =ターゲット集団 サンプル 集団 ターゲット妥当性=サンプル集団の推定値をターゲット 集団に適応することの妥当性(内的/⼀般化/外的妥当性等を包含する概念) サンプル元集団 サンプル 集団 ターゲット集団 サンプル元集団 サンプル 集団 ターゲット 集団 ⼀橋⼤⽣ ⼀橋⼤⽣ ⼀橋⼤⽣中の 不登校リスク 集団 ⼀橋⼤⽣ ハーバード⼤⽣ ⼀橋⼤⽣ ハーバード⼤⽣
  108. 解釈の”質的”吟味:ターゲット妥当性の分解 “⼀般化可能性”を巡るバイアスの分解と整理 ▪ サンプル元集団= ターゲット集団に おける真の因果効果 サンプル集団に おける真の因果効果 サンプル集団における 処置群間の差

    BIAS於サンプリング BIAS於⼀般化 =BIAS於サンプリング +BIAS於交絡 サンプル元集団 =ターゲット集団 サンプル 集団 ⼀橋⼤⽣ ⼀橋⼤⽣ BIAS於交絡 共変量は バランシング しているか? サンプリングは ランダムか?
  109. 解釈の”質的”吟味:ターゲット妥当性の分解 “移設(外的)可能性”を巡るバイアスの分解と整理 ▪ サンプル元集団Gに おける真の因果効果 サンプル集団に おける真の因果効果 ターゲット集団Hに おける真の因果効果 BIAS於サンプリング@

    集団G BIAS於移設 =BIAS於潜在結果 +BIAS於サンプリング +BIAS於交絡 BIAS於交絡 @集団G サンプル集団における 処置群間の差 サンプル元集団 サンプル 集団 ターゲット 集団 ハーバード⼤⽣ ⼀橋⼤⽣ ハーバード⼤⽣ サンプリングは ランダムか? 共変量は バランシング しているか? BIAS於移設@潜在結果 潜在反応は代替可能か? 「集団間(もしくは個体間)での 関数fおよび特性Zの分布の同等性」 構造的 類似性 特性的 類似性
  110. 解釈の”質的”吟味:ターゲット妥当性の分解 “移設(外的)可能性”を巡るバイアスの分解と整理 ▪ サンプル元集団Gに おける真の因果効果 サンプル集団に おける真の因果効果 ターゲット集団Hに おける真の因果効果 BIAS於サンプリング@

    集団G BIAS於移設 =BIAS於潜在結果 +BIAS於サンプリング +BIAS於交絡 BIAS於交絡 @集団G サンプル集団における 処置群間の差 サンプル元集団 サンプル 集団 ターゲット 集団 ハーバード⼤⽣ ⼀橋⼤⽣ ハーバード⼤⽣ サンプリングは ランダムか? 共変量は バランシング しているか? BIAS於移設@潜在結果 潜在反応は代替可能か? 「集団間(もしくは個体間)での 関数fおよび特性Zの分布の同等性」 構造的 類似性 特性的 類似性 ここのバイアスのチェックに 関して”量的”のアドバンテージ がどの程度あるかは実際問題と してかなり怪しいのではないか (c.f., RCT)
  111. 因果推論と「質的な研究」| 概念と移設可能性の吟味の重要性の例 Shoda et al. (1990) マシュマロ実験 「マシュマロを⾷べるのを我慢できた(7分待てた)⼦/ できなかった⼦」の⻑期追跡により、⼦供の”⾃制⼼ (delay

    of gratification)”が、その後の学業や社会⾏動にお ける成功において重要であることを⽰唆した 近年の追試的研究により、 - 概念解釈の妥当性 - 推定結果の移設可能性 の両⾯において結論(の捉え⽅)が疑問視されて きている
  112. 因果推論と「質的な研究」| 概念と移設可能性の吟味の重要性の例 Watts et al. (2018)マシュマロ実験の再試験 より⼤きくかつ多様なsample of childrenを調査 より洗練された統計モデルを使⽤

    Shodaらで⽰されていた”delay of gratification”と後 のachievementの関係は社会経済的要因と認知能⼒ で調整すると⼤幅に減少し、統計的調整⽅法によ り有意になったりならなったりする程度となった 尚、Shodaらの研究はいわゆる「再現性が怪しい」という話とは少し違って、 「研究/実験そのものの不備」ではなく( 解釈はともかく結果⾃体には⼀定の 再現性は認められる)、hypeがひどい(概念と移設可能性を真剣に吟味せずに ⼀般書で広めた点がひどい)例と思われる ←マシュマロ・テストとその後続研究については森⼝(2021)に現 在の知⾒がまとまっている
  113. 因果推論と「質的な研究」| 概念と移設可能性の吟味の重要性の例 再試験では”最初の20秒”でほぼ決まっていた 「測定しているのものは”何か”」「媒介しているも のは”何か” 」を質的に吟味しないと解釈を誤りうる The relationship between delay

    of gratification and academic achievement might be driven by the ability to generate useful metacognitive strategies that will influence self-regulation throughout one’s life. Shodaら (1990)での「7分待てること」の概念解釈 + 認知能⼒で調整すると効果量は⼤幅減 測定されていたのは”そもそも何だった“のか? 後続研究からむしろ「他者への信頼度」に近い指標であることが⽰唆されている
  114. 因果推論と「質的な研究」| 概念と移設可能性の吟味の重要性の例 ターゲット妥当性の観点から Shodaらの研究ではサンプル元 集団は⽐較的均⼀性が⾼い Shodaらの研究ではサンプル元 集団は多様性ありの設計 ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ

    BDIJFWFNFOU ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ BDIJFWFNFOU ଞऀ΁ͷ ৴པ౓ 4&4 എܠཁҼͷ ෼ࢄ͕খ͍͞ 移設可能性はかなり不明 ⽐較的に移設可能性の⾒通しあり 作業的 概念図の例
  115. パートIIの話の全体まとめ ▪ ▪ ▪ Rubinの因果モデルはSUTVA条件を所与の前提と することで、理論的な定義と解析プロトコルの⾒ 通しを明確にしている ⼀⽅、現実の系では(hidden) multiple versions

    があることは普通である、あるいは、概念の”厚 い”記述への志向はSUTVA条件の成⽴の難しさを 明らかにしがち ⼿元のサンプルからのターゲット妥当性を考える 際に、構造+特性的類似性が本質的な場合には量 的分析のアドバンテージはあるのか? 概念やターゲット妥当性の吟味に⽋けた量的分析 はしばしば実害があるレベルで解釈を誤りうる
  116. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  117. 因果推論と「質的な研究」| Evidence-Based Practicesの”往路”と”復路” 個人 集団A 集団A’ 集団Σ 集団因果効果の 推定量 法則的(タイプ的)

    個別的(トークン的) “往路” “復路” 論⽂を書くことを⽣業とする「研究者」 という⼈種はしばしば”往路”までのこと しか真剣に考えていない 𝛼, 𝛽, 𝛾 … エビデンス の⽣産 個人 個人 エビデンス の利⽤ 𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 … トークンto タイプ タイプto トークン 研究者は”丘の上”で論⽂を書く 復路では移設可能性/外的 妥当性が問題となる
  118. 因果推論と「質的な研究」| 個人 集団A 集団A’ 集団Σ 集団因果効果の 推定量 “往路” “復路” 𝛼,

    𝛽, 𝛾 … エビデンス の⽣産 個人 個人 エビデンス の利⽤ 𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 … トークンto タイプ EBPsにおける「RCT最強論」の半可通性 元ネタのEBMedicineは⼀定の ⽣物学的⻫⼀性を想定しうる 点で、EBPMと⼤きく異なる 「往路最強」かもだが、その強みのモデルフリー性 ⾃体が”復路”での⼤きな脆弱性を⽣む * Cf., Deaton and Cartwright 2017 ⼀般にRCTの内部には異なる状況 間の”距離”に対する情報が皆無 ? ? ? ? ?
  119. 因果推論と「質的な研究」| 質的な”⼿触り”の重要性:介⼊の⽂脈的な意味 𝑌D (ばんとらいん) = 𝑓(𝑋, 観測可能&数量化可能なもの, 数量化不可能なもの, 観測不可能なもの, 固有なもの,

    ⾮固有なもの … ) そもそもを⾔えば、個体の潜在反応は観測可能な もの/不可能なもの、数量化可能なもの/不可能 なもの/、固有なもの/⾮固有なものの全てに よって規定されている 観測可能&数量化可能なもの以外の個体の諸々は ”往路”にて”誤差”として⽚付けられてしまう 本当の「ばんとらいん」 の全て 半可通にとっての「ばんとらいん」 ぼくの名前は ばんとらいん ばんとらいんにとって”ばんとらいんでないもの”は⼀つもないのに!
  120. 因果推論と「質的な研究」| 𝑌D ばんとらいん = 𝑓(𝑋, 𝐶1, 𝐶2, 𝐶3, 𝐶4, 𝐶5,

    𝐶6, 𝐶7, 𝐶8, 𝐶9, 𝐶10 … ) 「(やや/概ね/完全に)断⽚的なもの」 ばんと らいん X→Yの法則性を 考える上で 交絡要因として 重要な特性 (バックドア基準を 満たす変数セット) (X→)Yの中範囲 の⼀般性を 考える上で ⽂脈上 重要な特性 特定の ⽂脈に 回収され ない特性 (X→)Yの固有性 を考える上で ⽂脈上 重要な特性 集団の因果効果の 推定の観点からは “断⽚的なノイズ” 集団の因果効果の 推定のために 考慮が必要 ばんとらいんにおけるX→Yの全体像は ここの特性も全て関わる
  121. 因果推論と「質的な研究」| 𝑌D ばんとらいん = 𝑓(𝑋, 𝐶1, 𝐶2, 𝐶3, 𝐶4, 𝐶5,

    𝐶6, 𝐶7, 𝐶8, 𝐶9, 𝐶10 … ) 「(やや/概ね/完全に)断⽚的なもの」 ばんと らいん X→Yの法則性を 考える上で 交絡要因として 重要な特性 (バックドア基準を 満たす変数セット) X→Yの中範囲の ⼀般性を 考える上で ⽂脈上 重要な特性 特定の ⽂脈に 回収され ない特性 Y→Xの固有性を 考える上で ⽂脈上 重要な特性 RCTではX以外の 全ての要因を “誤差”とみなす (断⽚的なノイズの集積) ばんとらいんの 固有性はほぼ 消去される
  122. 因果推論と「質的な研究」| 個人 集団A 集団A’ 集団Σ 集団因果効果の 推定量 “往路” “復路” 𝛼,

    𝛽, 𝛾 … エビデンス の⽣産 個人 個人 エビデンス の利⽤ 𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 … トークンto タイプ タイプto トークン 質的な”⼿触り”の重要性:介⼊の⽂脈的な意味 例えばリスク・コミュニケーションの 現場では「数値」のナラティブ内での 位置づけまでの考慮が必要となる 往路で”誤差”として⽚付けた「断⽚的なもの」に ”復路”でふたたび向き合うべきときがある こういう感覚が分からない⼈をコミュニケーター役にすると⼤抵ろくなことにならない
  123. 斎藤清⼆(2011,2012,2018)のEBM/NBM論 EBMの概念解釈の3類型(斎藤2012/松下2021より引⽤) ▪ 松下(2021)『⼼理療法における「エビデンス」とは何か』より引⽤ 1) EBM 正統派(批判的吟味派) EBM の定義と⽅法論を遵守する⽴場。エビデンスを疫学研究に よる経験的実証的情報と定義

    し、EBM の本質をエビデンスおよ びエビデンスを⽤いた臨床実践の批判的吟味におく。 2) ガイドライン派(グローバル・スタンダード派) エビデンスの定義は 1)と共通するが、EBM を「エビデンスに基 づいた診療ガイドラインを作成し、それを医療実践に普及させる こと」と捉える⽴場。エビデンスの格付けを重視する。 3) 伝統科学派(病態⽣理派) エビデンスを臨床疫学的な情報に限定せず、⽣物化学的な理論や 病態⽣理を推定する実験的 研究の成果を重視しようとする⽴場。 臨床実践が出発点 Treatment/治療法が出発点 本来のEBMは1)であるが、残念ながら2)として喧伝されている場合が多い
  124. 斎藤清⼆(2011,2012,2018)のEBM/NBM論 ⼆重構造をもつ実践科学としてのEBMの構造+NBM ▪ エビデンスの⽣成プロセス 厳密に統計的な実験デザイン 論⽂化 エビデンスの評価プロセス ⽅法論的妥当性の吟味 臨床的妥当性の吟味 エビ

    デンス EBMの実践プロセス 患者の問題の定式化 問題についての情報収集 得られた情報の批判的吟味 得られた情報の患者への適⽤ これまでの実践の評価 NBMによる 対話的臨床実践 ⽣成 利⽤ 吟味 吟味 合法則的合理性 合⽬的的合理性 合⽬的的合理性 実証主義的 世界観 解釈主義的世界観 客観的に存在する疾患 を治療/除去する≈ 患者の抱える「病いの物語」を 編み直す *この図は⻫藤(2018)を元に林が勝⼿にNBM部分を増築
  125. 斎藤清⼆(2011,2012,2018)のEBM/NBM論 EBMとNBMの調和/包含関係を考える ▪ 斎藤(2011)で⽰された3つの考え⽅の現状分類 ① EBMとNBMは相互に補完的であり、NBMを加えることに よってEBMの体系は完成するという楽観的な考え⽅ ② EBMとNBMは異なる2つの世界観であるが、患者と医師 の出会いの場⾯において共存しうるとする慎重な考え⽅

    ③ EBMとNBMは異なる2つの世界観であるが、患者と医師 の対話の現場において、NBMはEBMを包摂/統合するとい う⼤胆な考え⽅ →⽇本の多くのEBMの専⾨家はこの考え⽅。臨床実践の実感に合う →NBMの主張者の⼤部分はこの考え⽅(認識論の違いに対して慎重) →斎藤(2011)の⽴場。EBMはそれ⾃体が「有効に活⽤すべき⼀つの物語」 プラグマティズム的折衷/統合ともいえるかも 斎藤(2011)は「ナラティブ三年エビ⼋年」、つまり、EBMをしっかりと勉強して理解した⼈はNBMをすぐ理解するとも書いている 「偽権威」や「トンデモ医療」から患者を護るためにはEBMのしっかりした理解は必須
  126. 斎藤清⼆(2011,2012,2018)のEBM/NBM論 (補⾜)権威主義との闘争としての初期EBM c.f., h<ps://toge<er.com/li/1746410 近藤誠 外科医たちの 権威主義的な 癌治療実践 権威を笠にきた 苛烈な⼈格攻撃

    闇落ち *「ナラティブ三年エビ⼋年」を理解する上での背景のひとつ 「海外の論⽂がどうした、今ま でこうしてたんだからいいんだ、 俺の勘ではこうだからごちゃご ちゃいうな」 近藤⽒が最初期に⾔っていたこと は今では「当たり前のこと」に 海外の論⽂や エビデンスを もとにした批判
  127. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  128. 統計学因果推論と社会学:筒井(2019)を元に 筒井(2019)『計量社会学と因果推論』 ▪ ཧ࿦ͱํ๏ 34ר1߸ 2019೥਺ཧࣾձֶձ Sociological Theory and Methods

    Vol.34 No.1 2019 Japanese Association for Mathematical Sociology ಛू࿦จ ܭྔࣾձֶͱҼՌਪ࿦ɿ ؍࡯σʔλʹج͍ͮͨࣾձͷཧղʹ޲͚ͯ ౵Ҫ ३໵ʢ໋ཱؗେֶʣ ʦཁ໿ʧ ౷ܭతҼՌਪ࿦͸ܭྔ෼ੳͷओྲྀͱͳ͍ͬͯΔ͕ɼܭྔࣾձֶʹ͓͚Δͦͷҙຯ΍Πϯ ύΫτʹ͍ͭͯମܥతʹ࿦ͨ͡ݚڀ͸͍·ͩʹগͳ͍ɽຊ࿦จͰ͸ɼҼՌਪ࿦ϞσϧΛؚ Ήܭྔ෼ੳͷख๏ʹ͍ͭͯɼҟ࣭ੑͱ͍͏֓೦Λ࣠ʹ੔ཧ͠ɼͦͷ্Ͱܭྔࣾձֶ͕ҟ࣭ ੑʹରͯ͠ଞͷ෼໺ͷख๏ͱ͸ҟͳͬͨΞϓϩʔνΛͱΔ܏޲͕͋Δ͜ͱΛࣔ͢ɽ͜ͷ͜ ͱ͸ɼϚϧνϨϕϧ෼ੳͱ΋ݺ͹ΕΔࠞ߹ޮՌϞσϧͷ׆༻ʹ͓͍ͯ໌Β͔Ͱ͋Δɽ͞Β ʹɼհೖ΍੾அΛ༻͍ΔҼՌਪ࿦ΞϓϩʔνͱɼཁҼؒͷؔ࿈ੑΛڧௐ͢Δܭྔࣾձֶత Ξϓϩʔνͷҧ͍Λઆ໌͠ɼͦΕ͕ਓʑͷ֓೦࿈ؔΛࢀর͢ΔࣾձֶͷಛੑͷݱΕͰ͋Δɼ ͱ͍͏͜ͱΛ࿦͡Δɽ
  129. 統計学因果推論と社会学:筒井(2019)を元に 混合効果モデルを軸に異質性への態度を議論 ▪ 以上のように,混合効果モデルの発想は,個体の異質性の効果を除去した上で 固定効果 の推定値を得るという⽅針とは逆に,固定効果の影響を除去した上で 個体特有の効果の⼤ きさを追究する,という点にある. 因果推論においては異 質性がノイズであるのに対して,

    混合効果モデルにおいては固定効果こそがノ イズなのである. 混合効果モデルは y = X β + Zu + ε という基本形で表現できる.ここにおいて,Z は 説明 変数であり,たいてい X(切⽚を含む)の部分集合である.u は個体(クラス ター)間の 変量効果ベクトルであり,個体(クラスター)数× Z の⾏列である.ここ で個体とは,デー タの最⼩単位が集合して作られる集まり(クラスター)を指す. ⽣徒個⼈が最⼩単位であ るとき,その集まりである学級などが想定される. 混合効果モデルと固定効果モデルの⽐較の議論: 筒井(2019)より引⽤)
  130. 因果推論と「質的な研究」| 𝑌D ばんとらいん = 𝑓(𝑋, 𝐶1, 𝐶2, 𝐶3, 𝐶4, 𝐶5,

    𝐶6, 𝐶7, 𝐶8, 𝐶9, 𝐶10 … ) 「(やや/概ね/完全に)断⽚的なもの」 ばんと らいん X→Yの法則性を 考える上で 交絡要因として 重要な特性 (バックドア基準を 満たす変数セット) (X→)Yの中範囲 の⼀般性を 考える上で ⽂脈上 重要な特性 特定の ⽂脈に 回収され ない特性 (X→)Yの固有性 を考える上で ⽂脈上 重要な特性 集団の因果効果の 推定の観点からは “断⽚的なノイズ” 集団の因果効果の 推定のために 考慮が必要 ばんとらいんにおけるX→Yの全体像は ここの特性も全て関わる 個体の異質性 処置X (再掲スライド) 固定効果
  131. 統計学因果推論と社会学:筒井(2019)を元に ルービンの枠組みと「概念の厚み」 ▪ デモグラフィック変数が,少なくとも単純なかたちでは因果推論における「措置/ 介 ⼊」として考えにくくなるのは,さしあたりはそれが「動かない/動きにくい」 からだと 考えることができる.ただし,因果推論における介⼊の特徴は,それだけ だと捉えられな い,ということを強調しておきたい.というのは,しばしば注⽬さ

    れる⾃⼰選択との違い が,個体内変動がないことだけでは説明できないからだ.よ り根本的な違いは,デモグラ フィック変数が通常,介⼊変数と違って,《意味的 な厚みのある概念を反映》した変数で あるということにある.たとえば「学歴」に ついて考えてみよう.学歴は,家庭的背景, 能⼒,シグナル機能,アスピレーショ ンなど,さまざまな概念との関連において有意味な要因として理解される.関連す る要素(「他の条件」)をすべて剥ぎ取ってしまうと,もは や私たちは学歴という概 念について理解することが難しくなる.というのは,パールの語彙を使うと,ある 選択を介⼊として捉えるということは,因果ダイアグラムにおける「切 除」を意 味しているからだ. 因果推論の枠内においても,いわゆるメカニズムの分析におい ては,措置の効果の有意 味な解釈が可能である.たとえば学歴を割当することは原 理的には可能であるが,その結 果の解釈においては,学歴と関連する概念(たとえ ば教育を通じて取得された能⼒やスキ ル)を考慮した上で,効果を及ぼすメカニズ ムの分析・解釈がなされることになる.他⽅で, ルービン・モデルを使⽤した場 合,焦点を当てる要因が社会的なプロセスにおいてどのよ うな重要性を持ってい るのかについては,全体的な推論や解釈を⾏うことはできなくなる. 筒井(2019)より引⽤)
  132. 統計学因果推論と社会学:筒井(2019)を元に 社会学は何が知りたいのか? ▪ 例外は,シエや⽯⽥が記録している,ダンカンが「遺産」として残したとされる ⼀ 連の知⾒(Xie 2007; Goodman 2007)や,最近ではゴールドソープによる精⼒的な 発信で

    あろう.ダンカンは異質性こそが社会学の研究対象であると主張し(⽯⽥ 2012: 11),異質性をノイズとして捉える因果推論とは距離を置いた.ゴールドソー プは,(計量)社会 学を population science として特徴づける.population science とは, 統計データを通じて⼈ ⼝集団の規則性を確率論的に把握するものである 12) .ゴール ドソープによれば,統計学 的に発⾒された集団の規則性(たとえば出⽣率の低下)を もたらした諸原因について考 察する際に,ルービンの potential outcomes アプロー チの活動度が下がる(Goldthorpe 2016: 107). 筒井(2019)より引⽤ 観察データにおける変数は,それぞれ⼀定の「概念の厚み」を持っている.これと 対局 なのが実験における介⼊で,介⼊は⽂脈から切断された操作として,概念的 には空洞で あっても実施し,結果を観察することができる.もちろん,観察のレベ ルにおいても外⽣ 性のショックや制度的な断絶におけるように,⽂脈からの切断 は⽣じる.むしろ,だから こそ因果推論ではこれらのショックや切断を⾃然実験と して,介⼊の代わりに⽤いるので ある.他⽅で,社会的なプロセスの記述や理解 は,通常はこういった断絶を含まない,要因間の関連を想定してなされる.その意 味で,社会的プロセスの記述が社会学的な課題で あるとすれば,それは観察デー タに基づいて⾏われるしかない.
  133. 統計学因果推論と社会学:筒井(2019)を元に 研究課題に対する依存性 ▪ ただし,要素間の連関と断絶とは,そのあいだにグラデーションを含んだもので あり, ある要因の概念をどこまで分節化するのかは,当該概念の⼀般的理解のみ ならず,研究課 題に依存する.たとえば「学歴」と関連する要素(家庭的背景,ア スピレーション,能⼒, シグナリング等々)を切り離していき,学歴の⼀般的な概

    念理解を掘り崩すに⾄ったと しても,介⼊プログラムとしてそれが有意味である 場合には,問題がない.あるいは観察 データの分析において,出⾝家庭要因を切り 離した上で学歴による違いをみるといった場 合,進学が⾃⼰選択であることを勘 案しても,出⾝家庭要因とは独⽴した学歴の影響の⼤ きさをある程度推察するこ とができる.肝⼼なのは,因果の捉え⽅の⽔準にそった分析を ⾏うことである. 筒井(2019)より引⽤
  134. ҼՌޮՌਪఆͷجຊతͳߟ͑ํʢ౵Ҫ͔Βͷ຋Ҋʣ 9 : ; 9 : ; ここの関係だけ⾒たい! (それ以外はキャンセルしたい) ランダム化

    均⼀化 統計学的調整 学歴 (⼤学) 親の 社会階層 収⼊ 『計量社会学と因果推論』 統計学因果推論と社会学:筒井(2019)を元に
  135. ࣾձֶͰͷߟ͑ํʢ౵Ҫ͔Βͷ຋Ҋʣ 9 : ; 9 : ; 社会学は ここまでスコープに ⼊れてナンボでしょ

    Zの存在を キャンセルするのは ないわー 収⼊ 親の 社会階層 学歴 (⼤学) →より”説明”志向の⼿法選択 『計量社会学と因果推論』 統計学因果推論と社会学:筒井(2019)を元に 安易に“キャンセル”してはいけないものがあるのでは
  136. 因果推論と「質的な研究」| 概念と移設可能性の吟味の重要性の例 ターゲット妥当性の観点から Shodaらの研究ではサンプル元 集団は⽐較的均⼀性が⾼い Shodaらの研究ではサンプル元 集団は多様性ありの設計 ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ

    BDIJFWFNFOU ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ BDIJFWFNFOU ଞऀ΁ͷ ৴པ౓ 4&4 എܠཁҼͷ ෼ࢄ͕খ͍͞ 移設可能性はかなり不明 ⽐較的に移設可能性の⾒通しあり 作業的 概念図の例 (再掲スライド)
  137. 導⼊|統計的推測の主要な3⽬的(再掲) ⽬的の 分類 やりたいことの内容 事例のイメージ (⼤学の留年の例で) 理念的な理想をなす 解析法のイメージ しばしば 現実的な

    解析法 予測 現在得られている情報 から、将来/未知の値 /状況を予測したい (要因への介⼊は伴わない場合) 多数の変数の情報から、留年 リスクの⾼い学⽣を⾒つけた い(→その後⽀援につなげる など) 機械学習 回帰分析! 説明 要素間の関連性を説明 したい なぜ学⽣が留年するかを説明 したい(要因を探索し理解/ 対策につなげたい) フルスタックの 構造⽅程式 (含む因⼦分析等) 回帰分析! 因果/介⼊ 効果の推定 ある特定の要因に介⼊ したときの、ある特定 の要因への効果を知り たい 特定のプログラムの導⼊が留 年を防⽌する効果を知りたい ランダム化⽐較試験 回帰分析! (異論は認める) * *互いに排反な分類という意味ではないので注意 パート1では「因果効果の推定」が主テーマ ▪ 構造的因果モデルはこれらの⽅向性の 異なる世界線を架橋しうる点が嬉しい ʮհೖޮՌʯͱʮઆ໌ʯ͕੾Εͯ ͠·͏͜ͱͷةݥੑ (再掲スライド)
  138. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  139. I. 因果推論、構造から⾒るか?差分から⾒るか? II. 統計的因果推論における概念/解釈妥当性の 検討、そのドメイン知識との繋がり III. 法則性と固有性:EBM/EBPsにおける 「(やや/概ね/完全に)断⽚的なもの」 本⽇の構成(パートI-IV) IV.

    さて、われわれは何を知りたいのか? 〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果 モデル、加えて反事実シミュレーションについて 〜ドメイン知識で「SUTVAの井⼾の底」を掘る 〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える 〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに 「交絡要因の”キャンセルアウト”」の学問的含意を考える
  140. • 統計的因果推論では陰に陽に対象についての質的な知⾒を その基盤としており、その概念的および構造的仮定の質的 な吟味は重要である 全体のまとめ・雑感 • 潜在結果モデルは「潜在結果の差分」として因果効果を定 式化し、因果効果推定の解析プロトコルへの明瞭な⾒通し を与える •

    構造的因果モデルはissueの総合的理解へ向けた統計的/理 論的/理念的な枠組みの基盤となりうる • EBPsはしばしば「固有→法則→固有」の往復運動であり、 合⽬的的合理性の追求は半ば必然的に量的・質的の統合を 指向するのでは? • 統計的因果推論における⽅法論的”キャンセル”の学術的含 意と(その裏⾯の「説明」の学術的捉えがたさ)をどう考えるか