「学術的に理解する」ってどういうこと? ：統計的因果推論のフレームワークから見た「量的×質的」に関する眺望の (いささかとっちらかった)スケッチを共有する

先端課題研究会＠ 2021/7/21 @国⽴環境研究所社会システム領域林岳彦「学術的に理解する」ってどういうこと？統計的因果推論のフレームワークから⾒た「量的×質的」に関する眺望の（いささかとっちらかった）スケッチを共有する

統計的因果推論のフレームワークとはいかなるものかを理解することで統計的因果推論がいかに質的な知⾒を（しばしば暗黙に）その基盤としているか統計的因果推論のスコープがしばしばいかに”狭い＆薄い”のかを議論したい本⽇のねらい質的×量的に関して内容的には全く新規性のある話ではないが、「統計的因果推論の枠組みからはこう⾒える」という幾つかの眺望のスケッチを共有でき、それが何らかのヒントとなれば幸いです

＊私は質的研究には詳しいわけではありませんにわか勉強としてひとまず以下の本は読みました（その結果、本⽇の内容は何らかの形で既に⾔及されていると思った次第）

⾃⼰紹介｜どんな研究をしているのかもともとの出⾝は⽣態学（性淘汰・種分化理論）『性選択理論を整理する』（性淘汰理論を統⼀的に解説）種分化過程の個体ベースシミュレーション研究 Figure 2. The distribution
of locus effects in the genetic distance model with two loci. (A) Differentiation in the female locus only (th “Buridan’s Ass” regime). The population is from the simulation shown in Figure 1B at generation 7500. (B) Differentiation in both femal and male loci. The population is from the simulation shown in Figure 1B at generation 25,000. (C) Sympatric speciation with strong sexua conflict (Popt = 0.2). Upper white bars: female locus. Lower black bars: male locus. Parameters are the same as in Figure 1B unless specified case) of a haploid network when genetic diversification in both sexes occurred. It shows a population consisting of small, loosely connected clusters, rather than large and distinct clusters. The web structure among clusters shows that recombinant genotypes were common in the population. With the same parameter configuration, genetic differentiation is more likely in the eight-locus model (Table 2a) than in the two-locus model (Table 1a). This partly reflects the difference in the strength of selection pressure on each locus. When the number of loci is small, the selection pressure on each locus is strong and tends to suppress the genetic variance required to initiate genetic differentiation. Moreover, differentiation rarely occurs once coevolutionary chase begins. In contrast, genetic differentiation is still possible even when coevolutionary chase occurs in one of the Figure 3. Examples of haplotype networks. The ovals represent groups of individuals with the same haplotype. The length of a branc (more precisely, the number of nodes between clusters) represents the distance between haplotypes. These haplotype networks wer computed based on 50 individuals randomly sampled at generation 25,000. Parameters: Popt = 0.2, ␣ = 0.01, sc = 1.02, ␮ = 0.5 × 10−5 N = 10,000, unless specified. (A) Sympatric speciation in the two-locus genetic distance model with codominance. The data are from th simulation run shown in Figure 2C, ␣ = 0.05. (B) Genetic diversification without speciation in the eight-locus genetic distance mode with directional dominance. The data are from the simulation run shown in Figure 4A. (C) Sympatric speciation in the eight-locus geneti distance model with codominance, sc = 4 × 1.02. (D) Genetic diversification without speciation in the 32-locus genetic distance mode pairs of loci, provided that the number of loci is moderate (e.g L = 8). The codominance case.—Genetic differentiation in th loci of both sexes was often observed (Fig. 4B and Table 2b), al though the frequency of differentiation in male loci was smalle than in the directional dominance case. When selection in female was not sufficiently strong (i.e., sc = 1.02), no sympatric speci ation was observed (because of recombination among divergin loci). Strong female preference (␣ = 0.05) enhanced genetic dif ferentiations in the loci of both sexes but did not cause sympatri speciation (Table 2c). Decreased mutation rate (␮ = 10−5) sup pressed genetic differentiation, especially in male loci (Table 2d) No diversification was observed when population size was smal (N = 1000). 配偶者選択の基準が多様化することにより、集団内に遺伝的⽂化が⽣じる過程を研究 ORIGINAL ARTICLE doi:10.1111/j.1558-5646.2007.00059.x GENETIC DIFFERENTIATION BY SEXUAL CONFLICT Takehiko I. Hayashi,1,2 Michael Vose,3,4 and Sergey Gavrilets5,6 1Research Center for Chemical Risk Management, National Institute of Advanced Industrial Science and Technology, 16-1 Onogawa, Tsukuba, Ibaraki 305-8589, Japan 2E-mail: [email protected] 3Department of Computer Sciences, University of Tennessee, Knoxville, Tennessee 37996 4E-mail: [email protected] 5Department of Ecology and Evolutionary Biology, Department of Mathematics, University of Tennessee, Knoxville, Tennessee 37996 6E-mail: [email protected] Received June 6, 2006 Accepted October 31, 2006 Sexual conflict has been suggested as a general cause of genetic diversification in reproductive characters, and as a possible cause of speciation. We use individual-based simulations to study the dynamics of sexual conflict in an isolated diploid population with no spatial structure. To explore the effects of genetic details, we consider two different types of interlocus interaction between female and male traits, and three different types of intra-locus interaction. In the simulations, sexual conflict resulted in at least the following five regimes: (1) continuous coevolutionary chase, (2) evolution toward an equilibrium, (3) cyclic coevolution, (4) extensive genetic differentiation in female traits/genes only, and (5) extensive genetic differentiation in both male and female traits/genes. Genetic differentiation was hardly observed when the traits involved in reproduction were determined additively and interacted in a trait-by-trait way. When the traits interacted in a component-by-component way, genetic differentiation was frequently observed under relatively broad conditions. The likelihood of genetic differentiation largely depended on the number of loci and the type of within-locus dominance. With multiple loci per trait, genetic differentiation was often observed but sympatric speciation was typically hindered by recombination. Sympatric speciation was possible but only under restrictive conditions. Our simulations also highlight the importance of stochastic effects in the dynamics of sexual conflict. Hayashi et al. (2006) 研究の原点はフィールド観察にある、という感覚のある分野

⾃⼰紹介｜どんな研究をしているのか⽣態リスク評価、確率的リスク分析、因果推論 Yij θAlgae σj Means SD θFish Sensitivity differences
among taxonomic groups Normal distributions Log(NOEC) Parameters were estimated by MCMC simulations θInvertebrate 階層ベイズモデルとモンテカルロシミュレーションを⽤いた化学物質の⽣態リスクの定量化とリスク⽐較 Hayashi & Kashiwagi (2009) Hayashi & Kashiwagi (2010) Monte Carlo Analysis EPAF = F µ ECD - µ SSD s ECD 2 + s SSD 2 æ è ç ç ö ø ÷ ÷ µ ECD µ SSD s ECD s SSD Calculation of predictive distribution of EPAF Posterior distributions of ECD parameters Posterior distributions of SSD parameters Results: Quantitative Risk Comparison Median and 90% range of EPAF log10(EPAF) Large Risk→ ←Small Risk Chemicals Ammonia Copper Nickel Zinc Hayashi and Kashiwagi (2011) リスク／影響の確率論的解釈（個別-法則）

⾃⼰紹介｜どんな研究をしているのか『はじめてのバックドア基準』（Pearlの関数的因果モデルの解説）⽣態リスク評価、確率的リスク分析、因果推論ネオニコチノイド系農薬の⾚トンボへの影響の因果推論 !",$ = &",$ −
&"(),$ &"(),$ = +) ,-./)," − ,-./),"() + ⋯ + +2 ,-./2," − ,-./2,"() ++" 3-45" + 6) 7)," + ⋯ + 68 78," 背景知識からの因果モデルの構築バックドア基準に基づく統計モデルの構築因果効果の推定 Takeshita et al. (2020)など介⼊効果とドメイン知識

⾃⼰紹介｜どんな研究をしているのか社会対話、リスクコミュニケーション、EBPM @taiwa_kankyo の twitterアカウント社会対話・協働推進オフィス＠国環研のメンバーとしてコミュニケーション活動に参画 “エビデンス”とナラティブ

⾃⼰紹介｜どんな研究をしているのか社会対話、リスクコミュニケーション、EBPM “エビデンス”を政策利⽤する上で考慮されるべき論点を科学哲学者との共同研究により5x3表の形で整理 Environmental Science and Policy 116 (2021)
86–95 Fig. 1. Cross table of managerial points for EBPM in environmental policymaking. Note. Each perspective comprises of two levels: the issues involved in each phase, and a checklist for managing each stage in EBPM. H. Kano and T.I. Hayashi Environmental Science and Policy 116 (2021) 86–95 A framework for implementing evidence in policymaking: Perspectives and phases of evidence evaluation in the science-policy interaction Hiroyuki Kano a,*, Takehiko I. Hayashi b a Graduate School of Human Sciences, Osaka University, 1-2 Yamadaoka, Suita, Osaka, 565-0871, Japan b Center for Health and Environmental Risk Research, National Institute for Environmental Studies, 16-2 Onogawa, Tsukuba, Ibaraki, 305-8506, Japan A R T I C L E I N F O Keywords: Evidence-based policy Science-policy interface Reference guide Institutionalization Mercury A B S T R A C T The use of scientific knowledge in policymaking has been a subject of debate in the environmental sector. An essential task for the effective use of evidence in policymaking is for scientists and policymakers to share a common understanding of how evidence should be produced and used. The purpose of this study is to establish a reference framework that enables scientists and policymakers to align their sights to deal with evidence in policymaking. To develop the framework, we introduced five perspectives that cover the domains of science, policy, and the science-policy interface as: (1) methodological rigorousness; (2) consistency; (3) proximity; (4) social appropriateness; and (5) legitimacy. We then examined how the issues from these perspectives will transit through three phases of interaction between scientific investigation and political institutionalization via: (1) a pre-institutionalization phase, in which the academic and social framing of an issue was unclear; (2) a mid- institutionalization phase, in which the academic and social framing of an issue was established and institutionalization was advanced; and (3) a post-institutionalization phase, in which issues were recursively defined within the evidence evaluation system itself. The framework encourages scientists and policymakers to shift their perspectives to each phase of institutionalization. A case study on mercury pollution shows how the framework serves as a checklist for the comprehensive evaluation of evidence, which provides specific guidance that appropriately promotes evidence-based policymaking and its implementation. 1. Introduction The use of scientific knowledge in policymaking has been a subject of debate in the environmental sector. Although evidence-based policymaking has been advocated over the last twenty years, the idea has not transparent process for incorporating research evidence into policy de- cisions (Dicks et al., 2014); a systematic climate policy evaluation (Haug et al., 2010); a participatory and inclusive structures for policymaking (Lalor and Hickey, 2014); social interactions, socio-political environ- ments, and power relations in the knowledge production and its use Contents lists available at ScienceDirect Environmental Science and Policy journal homepage: www.elsevier.com/locate/envsci Kano and Hayashi (2021) “エビデンス”と公共政策

⾃⼰紹介｜どんな研究をしているのか学際的に複数分野を漂流してきた統計のエンドユーザーとして（しばしば明⽰的／⾮明⽰的に存在する）ドメインの知識／ニーズ／規範と統計解析を適切に接続するための仕事をしてきた「学術的に理解する」とはどういうことか？（ドメイン知識と統計解析の狭間で） Issue-drivenの分析者はこういうことを考えることがままあると思う

I. 因果推論、構造から⾒るか？差分から⾒るか？ II. 統計的因果推論における概念/解釈妥当性の検討、そのドメイン知識との繋がり III. 法則性と固有性：EBM/EBPsにおける「（やや／概ね／完全に）断⽚的なもの」本⽇の構成（IV部構成） IV.
さて、われわれは何を知りたいのか？〜⾮巡回有向グラフ(DAG)、潜在結果モデル、そして構造的因果モデル、加えて反事実シミュレーションについて〜ドメイン知識で「SUTVAの井⼾の底」を掘る〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに「交絡要因の”キャンセルアウト”」の学問的含意を考える

本⽇のテーマのプレビュー

本⽇のテーマのプレビュー (1)可能世界と反事実条件、および”世界間距離” (2)概念の同⼀性／異質性／妥当性 (3)法則性と固有性 (4)われわれは何が知りたいのか？ちょっとこの件だけ少し前置きとして説明させてください

前置き：反事実条件⽂と因果概念の定義 • 可能世界論からの「必然性」「可能性」の考え⽅「可能世界」の枠組みで考えれば⾊々と捗るよ！ S.クリプキ (1940-) 「Xが必然である」とは？全ての可能世界においてXが成り⽴つ「Xが可能である」とは？
少なくとも１つの可能世界においてXが成り⽴つ・世界について考えうる異なる「あり⽅」ごとに異なる「可能世界」がある・その中で我々が実際に暮らしているのこの世界が「現実世界」可能世界を考えることで、「必然性」や「可能性」という概念を論理的に定式化できる image

前置き：反事実条件⽂と因果概念の定義 • 可能世界論からの「因果」の考え⽅ D.ルイス (1941-) 「XがYの原因である」「同じ状況（到達可能な近傍の可能世界）において、もしもXが起こらなければ、Yは起こらなかっただろう」反事実依存性に基づく因果解釈
「covid-19の流⾏がオンラインでの授業の実施の原因である」「 covid-19の流⾏が起こらなければ、オンラインでの授業は実施されなかっただろう」 image

前置き：反事実条件⽂と因果概念の定義 • 反事実依存性と「因果推論の根本問題」「同じ状況（到達可能な近傍の可能世界）において、もしも Xが起こらなければ、Yは起こらなかっただろう」因果効果を次のように定義できそう： X→Yへの因果効果＝出来事Xが起きた世界におけるY - 出来事Xが起きなかった世界におけるY
しかし、「起きた世界」と「起きなかった世界」の両⽅を同時に観測することは原理的に不可能 “因果推論の根本問題” どちらかは必ず反事実的な世界となる例. コロナ禍

前置き：反事実条件⽂と因果概念の定義 • 反事実依存性と「因果推論の根本問題」「同じ状況（到達可能な近傍の可能世界）において、もしも Xが起こらなければ、Yは起こらなかっただろう」因果効果を次のように定義できそう： X→Yへの因果効果＝出来事Xが起きた世界におけるY - 出来事Xが起きなかった世界におけるY
しかし、「起きた世界」と「起きなかった世界」の両⽅を同時に観測することは原理的に不可能 “因果推論の根本問題” どちらかは必ず反事実的な世界となる例. コロナ禍 “反事実的な世界”を統計的に構成することによりこの「根本問題」を解決するのが「統計的因果推論」である（起こらなかった⽅の可能世界）

反事実条件⽂による因果定義の特徴 “⽔がからからになり、林の居室の花は枯れた” もし林が⽔をあげていたら、居室の花は枯れなかっただろうもしドナルド・トランプが⽔をあげていたら、居室の花は枯れなかっただろう林が⽔をあげなかったことが原因トランプが⽔をあげなかったことが原因？ (A) (B)
反事実条件⽂の内部には可能世界間の”距離”についての情報が皆無 ←この⽂も真！ ←この⽂は真 c.f., p. 147 in Sloman (2005) Causal models.

本⽇のテーマのプレビュー (1)可能世界と反事実条件、および”世界間距離” (2)概念の同⼀性／異質性／妥当性 (3)法則性と固有性 (4)われわれは何が知りたいのか？

本⽇のテーマのプレビュー v IL Morgan and Winship (2014) 『Counterfactuals and Causal
Inference: Methods and Principles for Social Research』 (2nd ed.) 本⽇の”こころの元ネタ” 今回具体的にこの本の内容の話をするわけではないが、話のスコープの根っこにはこの本のモチーフがあります

本⽇のテーマのプレビュー因果推論本おすすめフローチャートの例 https://www.bradyneal.com/which-causal-inference-book より引⽤

I. 因果推論、構造から⾒るか？差分から⾒るか？ II. 統計的因果推論における概念/解釈妥当性の検討、そのドメイン知識との繋がり III. 法則性と固有性：EBM/EBPsにおける「（やや／概ね／完全に）断⽚的なもの」本⽇の構成（パートI-IV） IV.
さて、われわれは何を知りたいのか？〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果モデル、加えて反事実シミュレーションについて〜ドメイン知識で「SUTVAの井⼾の底」を掘る〜斎藤清⼆(2011, 2012, 2018)を⼿がかりに量的/質的を考える〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに「交絡要因の”キャンセルアウト”」の学問的含意を考える

I. 因果推論、構造から⾒るか？差分から⾒るか？ II. 統計的因果推論における概念/解釈妥当性の検討、そのドメイン知識との繋がり筑波⼤学での分担講義「環境社会学：環境データ分析」の⼀部をベースにしたもの本⽇の構成（パートI-IV）〜⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的因果
モデル、加えて反事実シミュレーションについて〜ドメイン知識で「SUTVAの井⼾の底」を掘るなので質的×量的への⾔及がところどころ挟まりますが、基本的には授業っぽい内容です

前置き｜統計的推測の主要な3⽬的⽬的の分類やりたいことの内容事例のイメージ（⼤学の留年の例で）理念的な理想をなす解析法のイメージしばしば現実的な
解析法予測現在得られている情報から、将来／未知の値／状況を予測したい（要因への介⼊は伴わない場合）多数の変数の情報から、留年リスクの⾼い学⽣を⾒つけたい（→その後の⽀援につなげるなど）機械学習回帰分析！説明・記述要素間の関連性を説明したいなぜ学⽣が留年するかを説明したい（要因を探索し理解／対策につなげたい）フルスタックの構造⽅程式（含む因⼦分析等）回帰分析！因果／介⼊効果の推定ある要因Xに介⼊したときの、要因Yに及ぼす効果を知りたい特定のプログラムの導⼊が留年を防⽌する効果を知りたいランダム化⽐較試験回帰分析！⼀⾒同じ「回帰分析」でも、⽬的に応じて係数の解釈のあり⽅も、重要となる仮定群も異なる（異論は認める）＊＊互いに排反な分類という意味ではないので注意 ↑ パートI,IIでは「因果効果の推定」が主テーマ ▪ （余談）

前置きパートIのテーマ：「構造」と「差分」の視点の統合「対象を理解すること」にとって統計的因果推論とは何か？⾮巡回有向グラフ(DAG) 潜在結果モデル構造的因果モデル 𝒀 = 𝑿𝒀𝟏
+ (𝟏 − 𝑿)𝒀𝟎 X Y Z1 Z2 Z3 Average Causal Effect = 𝑬[𝒀𝟏] − 𝑬[𝒀𝟎] 𝑋: = 𝑔: 𝑝𝑎 𝑋: , 𝜀: 𝑖 = 1, … , 𝑝 「差異からみた因果」「構造からみた因果」

バックドア基準は、背景にある因果構造を基に「バイアスのない因果効果推定」のためにはどの変数を考慮するべきかの理論的条件を与える (Preview) パートIの話の全体まとめ ▪ 潜在結果モデルは「潜在結果の差分」として因果効果を定式化し、因果効果推定の解析プロトコルへの明瞭な⾒通しを与える ▪
構造的因果モデルは⾮常に広いクラスの因果効果の推定アプローチを包含しうるものであり、issueの総合的理解へ向けた統計的／理論的／理念的な枠組みの基盤となりうる ▪

1. 構造から⾒た統計的因果推論：DAGとバックドア基準の⼊⾨ 2. 差分から⾒た統計的因果推論：潜在結果モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現
(2) 潜在結果モデルのSCMによる表現 (3) 潜在結果モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へパートIの⽬次 0. 序：因果と相関と「対象の多様なありよう」

因果推論のはじまりの場所｜初⼼に戻り「対象のありよう」を丁寧に考える 10個のリンゴがあります統計の教科書が想定してる「ありよう」は Exchangeable!

Exchangeable? 因果推論のはじまりの場所｜初⼼に戻り「対象のありよう」を丁寧に考える 10個のリンゴがあります現実はしばしば「ふぞろいのリンゴ」である

因果推論のはじまりの場所｜因果推論でまず重要なのは「対象集団のありよう」について丁寧に省察することであるある意味、統計的因果推論とは集団内の異質性／⾮均⼀性を巡る体系である（後述）「ありよう」の質的な省察は推論の⼟台をなす Exchangeable?

相関と因果がズレるとき｜仮想例として「肥料X→リンゴの糖度Y」の因果効果を考えてみる（まずは均⼀品種バージョン）肥料Xを与えると糖度Yは単純に+2されるもともとのリンゴの糖度Yの平均は16、分散は1.0 「肥料X=あり」で育てたリンゴは50個「肥料X=なし」で育てたリンゴは50個肥料X=あり/なしの糖度Yをプロットするとつまり「真の因果効果」は
+2.0

3 8 12 16 20 −1 0 1 2 3
8 12 16 20 −1 0 1 2 3 相関と因果がズレるとき｜なしあり肥料X 糖度 Y 「肥料X→リンゴの糖度Y」の散布図（1品種ver） +2.1 各処理グループ平均の差(+2.1) 「真の因果効果(+2)」 ≒ 散布図上での差を因果効果としてそのまま解釈可能＝バイアスなしここでのバイアスの定義＝「真の因果効果」と「観測された処理グループ平均の差」の系統的なズレ

相関と因果がズレるとき｜「ぺこ」と「すまいる」の２つのリンゴ品種がサンプル内に混在している肥料X=あり/なしの糖度Yをプロットすると元々の「ぺこ」の糖度Yの平均は16 元々の「すまいる」の糖度Yの平均は12 その他の設定・仮定は先程の例と同一ひきつづき「肥料X→リンゴの糖度Y」の因果効果を考えてみる（２品種への拡張バージョン）

3 8 −1 0 1 2 3 3 8 12
16 20 −1 0 1 2 3 相関と因果がズレるとき｜なしあり肥料X 糖度 Y 「肥料X→リンゴの糖度Y」の散布図（２品種ver） +4.4 各処理グループ平均の差(+4.4) 「真の因果効果(+2)」 ≠ （他の設定は同⼀でも）２種類の品種が混在するだけでバイアスが⽣じるここでのバイアスの定義＝「真の因果効果」と「観測された処理グループ平均の差」の系統的なズレ

相関と因果がズレるとき｜品種が混在するときは必ずバイアスが⽣じる？ 8 12 −1 0 1 2 3 8
12 −1 0 1 2 3 8 12 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 20 20 20 +4.4 +2.0 -0.8 なしあり肥料X 糖度 Y なしあり肥料X なしあり肥料X 40/10 10/40 25/25 25/25 40/10 10/40 「品種の⽐率」が処理グループ間で同じときにはバイアスが⽣じないぺこ/すまいる比（総数ではぺこ50個/すまいる50個）

8 12 −1 0 1 2 3 8 12 −1
0 1 2 3 8 12 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 8 12 16 20 −1 0 1 2 3 相関と因果がズレるとき｜品種が混在するときは必ずバイアスが⽣じる？ +3.3 +2.2 +0.8 なしあり肥料X 糖度 Y なしあり肥料X なしあり肥料X ぺこ/すまいる比 8/42 2/48 5/45 5/45 8/42 2/48 「品種の⽐率」が処理グループ間で同じときにはバイアスが⽣じない（総数ではぺこ10個/すまいる90個）ここ⼤事

相関と因果がズレるとき｜「品種の⽐率」が処理グループ間で同じときにはバイアスが⽣じない「特性（共変量）のありよう」が処理グループ間で同じときにはバイアスが⽣じない統計的因果推論の要点：処理と共変量の独⽴性処理グループ間で「共変量がバランシングしている」みたいな⾔い⽅もしますこの例を⼀般化すると数式だと
P(共変量Z|X=あり)=P(共変量Z|X=なし) 統計的因果推論の主要な企みとは、上記の独⽴性を実験計画や解析の⼯夫により達成すること

相関と因果がズレるとき｜対処例：層別化による処理と共変量の「独⽴化」鱿鱘ݸ 鱞鲃鱉鲐ݸ 鱿鱘ݸ 鱞鲃鱉鲐ݸ ʮංྉ9鱇鲏ʯ鱳಺༁ ʮංྉ9鱯鱜ʯ鱳಺༁ ౶ ౓
ංྉ9 鱯鱜鱇鲏 ౶ ౓ ංྉ9 鱯鱜鱇鲏 ౶ ౓ ංྉ9 鱯鱜鱇鲏『』層別解析『』層別解析層別化で処理間の共変量を揃える→バイアスが消える

相関と因果がズレるとき｜ここまでの⼩まとめサンプルの特性がまったく均⼀のときにはバイアスが⽣じない＊ここでのバイアスの定義＝「真の因果効果」と「観測された処理グループ平均の差」の系統的なズレ処理グループ間で特性（共変量）の分布が同じときにはバイアスが⽣じないこの意味で、因果推論とは「対象集団における異質性への対処」を巡る体系である
因果推論の主要な企みとは、この状況を実験計画や解析の⼯夫により達成すること＊また、そもそも異質性（たとえば品種）を⾒分けることができなければバイアスの存在にも気づけない（→質的な省察が推論の⼟台となる）

相関と因果がズレるとき｜ひとくちに「特性の分布が同じ」といっても無数の「特性」がありうるわけで… その全ての特性（全ての共変量）を処理間で揃えなければならないの？ここで少し考えてみよう「揃えるべき特性」と「揃えなくてもよい特性」を判別する理論的基準はあるのか？＊たとえばリンゴの「特性」を考えても、品種、産地、農法、農家、流通形態、収穫時期、価格、などなどいくらでもありうるわけで…
細かく考えていくときりがない！

導⼊｜相関と因果は違う散布図上の相関関係からの素朴な予測や期待と因果効果（介⼊効果）がズレることがある ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬
ͷ छ ਺ : p < 0.001 「Xが⼩さいとき、Yは⼤きい」（=相関関係がある）とほぼ確実に⾔える

導⼊｜相関と因果は違う散布図上の相関関係からの素朴な予測や期待と因果効果（介⼊効果）がズレることがある ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬
ͷ छ ਺ : p < 0.001 「Xが⼩さいとき、Yは⼤きい」（=相関関係がある）とほぼ確実に⾔える「Xを⼩さくすると、Yは⼤きくなる」（=因果関係がある）と⾔えるか？

導⼊｜相関と因果は違うもしXとYの相関が「Xと関係ない要因」で⽣じているならば、Xを減少させてもYは回復しない ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬
ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ

導⼊｜相関と因果は違うもしYの状態がXにより⽣じているならば、Xを減少させればYは回復する ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬
ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ

導⼊｜相関と因果は違うもしYの状態がXにより部分的に⽣じているならば、Xを減少させればYは部分的に回復する ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬
ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ 「Xを⼩さくすると、Yは⼤きくなる」かは Yの状態が何によって⽣じているかに依存する

導⼊｜相関と因果で必要とされる⽅法論が違う「Xが⼩さいとき、Yは⼤きい」か？ ∈「相関関係(association)」についての問い p(Y|X=⼩さい) やるべきこと：Xが⼩さいときのYの計算 ←所与の数値のみから計算できる ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ
ੜ ࠛ ஬ ͷ छ ਺ : p < 0.001

導⼊｜相関と因果で必要とされる⽅法論が違う「Xを⼩さくすると、Yは⼤きくなる」か？ ∈「因果的影響(causal effect)」についての問い p(Y|X=do(⼩さい)) やるべきこと：Xを⼩さくしたときのYの計算 ←計算に因果的情報が必要 ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ
ੜ ࠛ ஬ ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ

導⼊｜相関と因果で必要とされる⽅法論が違う p(Y|X=⼩さい) Xが⼩さいときのYの計算 p(Y|X=do(⼩さい)) Xを⼩さくしたときのYの計算因果の問題相関の問題 p(Y|X=see(⼩さい)) あるいは、いうなればなぜズレるの？
交絡のせい！内⽣性のせい！⼀歩込み⼊った議論をする際に判断に迷うことがある最初の⽬標「バックドアパスが開いているせい」「バックドア基準が満たされていないせい」とい説明の仕⽅・概念を理解する association

前置き｜バックドア基準は「何について」の話？ ▪ 例えば、重回帰モデルの場合モデルに追加された説明変数の組が「X→Y」についてバックドア基準を満たすとき、重回帰分析から得られたXの偏回帰係数をそのまま「X→Yの介⼊効果」のバイアスのない推定量とみなせる例えば、「シンプソンのパラドックス」(ここでは、どの変数で層別化するかによって推定結果が変るケースの意味で⽤いる）が⽣じている場合興味の対象となる「処理X→結果Y」についてバックドア基準を満たす変数で層別化して解析すれば「X→Yの介⼊効果」をバイアスなく推定できる
具体的には、バックドア基準を満たすと：＊データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話ですバックドア基準は介⼊効果推定での変数選択の基準をもたらす

今⽇の話｜バックドア基準とは？（ざっくり） “バックドア基準が満たされている” ▪ “バックドアパス”って何？ “開く／閉じる”ってどういうこと？ + (2) 処理X→結果Yの道がブロックされていない (1)
開きっぱなしのバックドアパスがない ≒ “ブロック”って何？

超ざっくり説明｜”バックドアパス”とは？ n 因果構造を丘にある「⼈⼯池」でイメージする迂遠かもしれませんが、因果の「流れ」のアナロジーとして有効だと思うので少々お付き合いいただければ・・ X Y ＊降⾬の影響などは考えない本講演を通して X:
処理 Y: 結果 Z: 共変量で表記します＊ Y=βX+γ+ε ⼈⼯池⼈⼯池⽔路

超ざっくり説明｜”バックドアパス”とは？ n ⽤語説明：⾮巡回有向グラフ DAG⾃体は⾮常に広いクラスのモデルを表現しうる。たとえば、原理的には、時系列的なsequentialな数値シミュレーションを書ける系はDAGの形で描ける X Y “親” “⼦” “祖先”
“⼦孫” (Directed Acyclic Graph; DAG) 𝑎;<= 𝑎; 𝑎;>= 𝑌;<= 𝑌; 𝑌;>= 状態空間モデルの例

超ざっくり説明｜”バックドアパス”とは？「バックドアパス」=『処理Xと結果Yの上流側にある両者に影響を与える流れ』 ▪ X Y Z1 Z2 （X→Yの）バックドアパス
上流側にある「Z1」にインクをぶちまけると XにもYにも到達する (＝両者に影響を与える)

ではない！上流側にある「Z1」にインクをぶちまけても Yにしか到達しない (＝両者には影響を与えない)

ではない！上流側にある「Z1」にインクをぶちまけても Xにしか到達しない (＝両者には影響を与えない)

ではない！上流側にある「Z1」にインクをぶちまけても Xにしか到達しない (＝両者には影響を与えない) ＊Xそのものを通してYへ繋がる流れはノーカウント

超ざっくり説明｜バックドアパスの何が問題？上流側の変動に伴い”シンクロ”が⽣じる ▪ X Y Z X Y Zの変動によりX-Y間に "シンクロ"が⽣じる
Zが⼤ Zが⼩（X→Yの）バックドアパスこのZの変動によるシンクロが”疑似相関”を⽣み、 X→Yの介⼊効果の推定にバイアスをもたらす⾮因果的連関

超ざっくり説明｜バックドアパスの何が問題？参考：バックドアパスがない場合の例 ▪ X Y Z X Y Zの変動でX-Y間に “シンクロ”は⽣じない
Zが⼤ Zが⼩バックドアパスがないとき、Zの変動はバイアス・擬似相関の原因とならない

今⽇の話｜バックドア基準とは？（ざっくり） “バックドア基準が満たされている” ▪ “バックドアパス”って何？ “開く／閉じる”ってどういうこと？ + (2) 処理X→結果Yの道がブロックされていない (1)

超ざっくり説明｜バックドアパスが”閉じる”とは？バックドアパスが”閉じる”=バックドアパス上の変数を”固定”する ▪ X Y Z Zを“固定”するバックドアパスが”閉じ” 交絡の影響が消える
シンクロを⽣む流れが “ブロック”される Zで層別化して解析重回帰分析の共変量としてZをモデルに追加 “固定”= 条件付けconditioning の⼿法の例・・

超ざっくり説明｜バックドアパスが”閉じる”とは？参考：Zでの層別化（X：汚染濃度, Y：種数, Z：流域） ▪ 「上流」「下流」の層別に X→Yの効果を計算して集計する Z:流域 X:汚染濃度
Y:種数流域Zを層別化により”固定”し解析することで交絡の影響が消え、介⼊効果がバイアスなく推定できる ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬ ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ

超ざっくり説明｜パスが”開きっぱなし”とは？バックドアパスが開きっぱなし＝変数が固定されずパスの流れが”ブロック”されていない ▪ X Y Z X Y Zの変動によりX-Y間に
"シンクロ"が⽣じる Zが⼤ Zが⼩（X→Yの）バックドアパス⾮因果的連関介⼊効果の推定のバイアスが調整されぬまま残る

超ざっくり追記｜固定により”開く”こともある合流点を固定すると、“親”の間に双⽅向パスが開く ▪ バックドアパスが “開いた”状態 X Y Z （X→Yの）
バックドアパス⼦親親バックドアパスのない状態 X Y Z Zを“固定

超ざっくり追記｜固定により”開く”こともある合流点を固定すると、“親”の間に双⽅向パスが開く ▪ バックドアパスが “開いた”状態 X Y Z （X→Yの）
バックドアパス⼦親親バックドアパスのない状態 X Y Z Zを“固定 “⼦はかすがい”

超ざっくり追記｜固定により”開く”こともある参考：合流点となる「合否」を”固定” ▪ 実技試験 Z:合否 Y:実技試験
美⼤の⼊学試験における仮想例合否Zで層別化すると、XとYの間に⾮因果的な連関が⽣じ、X→Yの介⼊効果の推定にバイアスが⽣じる合格者 Z=1 不合格者 Z=0 X:学⼒試験 100 100 学⼒試験合格ライン

内容の説明｜バックドア基準とは？（概要版） “バックドア基準が満たされている” ▪ “バックドアパス”って何？ “開く／閉じる”ってどういうこと？ + (2) 処理X→結果Yの道がブロックされていない (1)

超ざっくり説明｜ ”X→Yの道がブロックされてない” Zが中間点の場合は”固定”してはいけない ▪ Z Y X X Y Zを"固定"しなければ、何の問題も⽣じない

超ざっくり説明｜ ”X→Yの道を閉じるな” 中間点をZを固定すると、Xからの「介⼊効果」の流れ⾃体がブロックされてしまう ("overconditioning") ▪ 在来種Aを護るための外来種Bの駆除の効果（仮想例） Z:外来種B の根絶
Y:在来種A の個体数 X:外来種B の駆除努⼒外来種Bの駆除努⼒在来種 A の個体数 छBͷࠜઈʹ੒ޭ(Z=1) छBͷࠜઈʹࣦഊ(Z=0)

内容の説明｜バックドア基準とは？（概要版） “バックドア基準が満たされている” ▪ “バックドアパス”って何？ “開く／閉じる”ってどういうこと？ + (2) 処理X→結果Yの道がブロックされていない (1)

具体例でおさらい｜３変量（X, Y, Z）の場合 3変量で⾒る”ほぼバックドア基準” ▪ X Y Z )
X Y Z ) X Z Y ( ) Zを加えよ Zを加えるな＊３変量の場合では、巷の”rule-of-thumb”的な変数選択ルール以上のご利益はあまり感じられないかも

具体例でおさらい｜ 4変量の場合変数ベースではなく”道“の開閉がキモ ▪ このどの場合もバックドアパスは閉じられている＊どのケースもXとYの"シンクロ"の原因となりうる上流側の流れが遮断されている X Y Z2 Z1
X Y X Y Z1 Z2 Z2 Z1

4変量以上の場合｜本質は”道”にあり 4変量以上の”道”：合流点の例 ▪ Z1 X Z2 Y Z3 Z1 X
Y Z3 X Z2 Y Z3 X→Y Z1 Z2 X Y Z3 Z1 Z2 バックドアパスが "開いている" バックドアパスは"閉まっている" バックドアパスの”道”がブロックされていることが肝要

4変量以上の場合｜本質は”道”にあり 4変量以上の”道”：中間点の場合 ▪ X Y Z2 Z1 Z1, Z2は中間点絶対にモデルに追加
したらダメ？中間点を⼊れるとXからの因果効果⾃体がブロックされてしまうのでダメ！（これは3変量の場合と同様）

4変量以上の場合｜本質は”道”にあり 4変量以上の”道”：中間点の場合 ▪ X Y Z1 Z2 全体としてX→Yの因果の"道"がブロックされないことが肝要 X Y
X Y Z2 Z1 Z1 Z2

4変量以上の場合｜まとめ X Y Z2 Z1 X Y X Y Z1
Z2 Z2 Z1 X Y Z1 Z2 X Y X Y Z2 Z1 Z1 Z2 バックドアパスをブロックしろ X→Yの道をブロックするなもうほとんどバックドア基準細かい論点をのぞけば畢竟, 以下２つのメッセージに集約される ▪

"まとめ"としてのバックドア基準教科書内の「バックドア基準」を解読してみよう⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤ ▪

ステップ6 | "まとめ"としてのバックドア基準教科書内の「バックドア基準」を解読してみよう⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤ ▪ 1. XからZの任意の要素に有向道がない 2.
GよりXから出る⽮線（X→）を除いたグラフにおいて、 ZがXとYを有向分離する定義 3-5 バックドア基準（back door criterion） “逆”のケース（XがYの下流）ではない⾮巡回的有向グラフGにおいてXはYの⾮⼦孫である。このとき、次の２条件を満たす頂点集合Zは、（X, Y）についてバックドア基準を満たすという例：中間変数や下流の合流点 Xの下流の共変量をモデルに加えてはいけないバックドアパスがブロックされている

4変量以上の場合｜まとめ（再掲） X Y Z2 Z1 X Y X Y Z1
Z2 Z2 Z1 X Y Z1 Z2 X Y X Y Z2 Z1 Z1 Z2 バックドアパスをブロックしろ X→Yの道をブロックするなもうほとんどバックドア基準ものすごい細かい論点をのぞけば畢竟, 以下２つのメッセージに集約される ▪ 条件(1)に対応条件(2)に対応

例題その１｜どの変数を加えれば良い？ X Y Z1 Z2 Z3 バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクをぶちまけたらどうなるか」を考えてみよう！

例題その１｜どの変数を加えれば良い？ X Y Z1 Z2 Z3 Z1にインクをぶちまけると XとYの両⽅にインクは到達するバックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクをぶちまけたらどうなるか」を考えてみよう！

例題その１｜どの変数を加えれば良い？バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクをぶちまけたらどうなるか」を考えてみよう！ X Y Z1 Z2 Z3 Z2にインクをぶちまけると
XとYの両⽅にインクは到達する

例題その１｜どの変数を加えれば良い？バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクをぶちまけたらどうなるか」を考えてみよう！ X Y Z1 Z2 Z3 Z2からはこういう
経路もある

例題その１｜どの変数を加えれば良い？バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクをぶちまけたらどうなるか」を考えてみよう！ X Y Z1 Z2 Z3 Z2からはこの
経路もある

例題その１｜どの変数を加えれば良い？ X Y Z1 Z2 Z3 バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクをぶちまけたらどうなるか」を考えてみよう！全部で4つのバックドアパス
がある

例題その１｜どの変数を加えれば良い？ X Y Z3 Z2 Z1 Z1, Z2をブロックすると３つのバックドアパスが全て遮断されるバックドア基準を満たす最⼩の変数セットは「Z1,
Z2」＊「Z1, Z2, Z3」もバックドア基準を満たします

例題その２｜どの変数を加えれば良い？ X Y Z1 Z4 Z3 Z2 Z5 Z6

例題その２｜どの変数を加えれば良い？ X Y Z4 Z3 Z2 Z5 Z6 Z1 Z1をブロックすると２つの
バックドアパスが全て遮断される

例題その２｜どの変数を加えれば良い？ X Y Z4 Z3 Z2 Z5 Z6 Z1 バックドア基準
を満たす最⼩の変数セットは「Z1」＊ここでZ5, Z6を⼊れると新たなバックドアパスが開いてしまう＊Z4はそもそも中間点なので⼊れてはダメ Z1をブロックすると２つのバックドアパスが全て遮断される

⼀部が不明な場合｜どの変数を加えれば良い？ X Y Z1 Z2 この部分の因果構造は不明

⼀部が不明な場合｜どの変数を加えれば良い？ X Y Z1 Z2 この部分の因果構造は不明バックドアパスがある場合、必ず Z1,
Z2のどちらかを通る

⼀部が不明な場合｜どの変数を加えれば良い？ X Z1 Z2 この部分の因果構造は不明 Y 「Z1, Z2」を加えればバックドア基準を満たす Z1,
Z2をブロックすればバックドアパスは遮断されるポイントとなる部分の適切な粒度の背景知識があればよい

⼀部が不明な場合｜どの変数を加えれば良い？ X Z1 Z2 この部分の因果構造は不明 Y Z1, Z2をブロックすればバックドアパスは
遮断されるポイントとなる部分の適切な粒度の背景知識があればよい

image 例題その3| どの変数を加えれば良いのか？ • 構造の全てを知る必要は全くない：路線図の喩えつくば⽴川守⾕駅さえ封鎖すれば林は（電⾞では）家に帰れない

例題その3| どの変数を加えれば良いのか？ • 構造の全てを知る必要は全くない：路線図の喩え image

例題その3| どの変数を加えれば良いのか？ • 構造の全てを知る必要は全くない：路線図の喩えつくば駅⽴川駅守⾕駅極度に
複雑な鉄道網必要なのは「守⾕の先は⼀本線」という"背景知識"のみポイントとなる部分の適切な粒度の背景知識があればよい TX

例題その3| どの変数を加えれば良いのか？調整すべき変数の数は「処置Xを⽣じさせるシステム」と「結果 Yを⽣じさせるシステム」のデカップリングの程度に依存する（⼀般論として） X Y Z2 Z6 Z5
Z7 Z1 Z3 Z4 Z10 Z11 Z9 Z8

Z7 Z1 Z3 Z4 Z10 Z11 Z9 Z8 バックドアパスの成因となる変数=4 Xを⽣じさせるシステム Yを⽣じさせるシステム

Z7 Z1 Z3 Z4 Z10 Z11 Z9 Z8 バックドアパスの成因となる変数=11 Xを⽣じさせるシステム Yを⽣じさせるシステム

Z7 Z1 Z3 Z4 Z10 Z11 Z9 Z8 バックドアパスの成因となる変数=0 いわゆる”⾃然実験”のケース Xを⽣じさせるシステム Yを⽣じさせるシステム調整すべき変数の数はかなり対象と⽂脈に依存する＊あと実務上はバックドアパスが閉じているかはゼロイチの話ではない

補⾜｜実験における無作為化との関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 So
many バックドアパス実験はランダム⽣成機によりバックドアパスを閉じる ▪

補⾜｜実験における無作為化との関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 コイントス
実験は”ランダム⽣成機”によりバックドアパスを閉じる ▪

補⾜｜傾向スコアとの関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 So
many バックドアパス傾向スコアはバックドアパスをブロックする"合成変数" ▪

補⾜｜傾向スコアとの関係 X Y Z1 Z3 Z2 Z5 Z6 Z4
e 傾向スコアでまとめてブロック傾向スコアはバックドアパスをブロックする"合成変数" ▪ うまく適⽤できれば超強⼒な⼿法！

補⾜｜差の差分析との関係差の差分析は差分データ化してバックドアパスを消す ▪ X Y Z1 Z3 Z2 ΔX
ΔY t t t t t X Y Z1 Z3 Z2 t' t' t' t' t' 時点t 時点tʼ 全要因の時点間差分をとる Z1, Z2, Z3が時間不変ならば ΔZ1, ΔZ2, ΔZ3はゼロ（項がキャンセルアウトされる）バックドアパスは消失

（再掲）｜バックドア基準は「何について」の話？ ▪ 例えば、重回帰モデルの場合モデルに追加された説明変数の組が「X→Y」についてバックドア基準を満たすとき、重回帰分析から得られたXの偏回帰係数をそのまま「X→Yの介⼊効果」のバイアスのない推定量とみなせる例えば、「シンプソンのパラドックス」(ここでは、どの変数で層別化するかによって推定結果が変るケースの意味で⽤いる）が⽣じている場合興味の対象となる「処理X→結果Y」についてバックドア基準を満たす変数
で層別化して解析すれば「X→Yの介⼊効果」をバイアスなく推定できる具体的には、バックドア基準を満たすと：＊データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話ですバックドア基準は介⼊効果推定での変数選択の基準をもたらす

I. DAGとバックドア基準のまとめ “バックドア基準が満たされている” ▪ + (2) 処理Xの下流の変数が追加されていない (1) 開きっぱなしのバックドアパスがない ≒
変数ベースではなく”道”の開閉がキモ ▪ ・たとえ森羅万象が因果関係で繋がっていても、因果効果を識別可能とするために考えるべき局所的な因果構造と変数の範囲を理論的に限定できる・傾向スコアもバックドアパスを閉じるための強⼒な⼿法（バックドア基準は理論的条件）介⼊効果がバイアスなく推定できる＊データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です

林岳彦・⿊⽊学（2016）｢相関関係」と「因果関係」は違います。これはよく知られています。ある要因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって，それらのあいだに因果的な関係があるとは限りません。一方で，そのような高い相関を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいところです。もしあなたの同僚やクライアントが，あなたが作成した散布図を見て
「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。このとき，「この場合はこれこれこうだからこの相関関係は因果関係として解釈できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは，それほど簡単なことではありません。こと因果関係の話になると，自分の頭の中でその内容を整理するのも，その内容を相手に伝わるように説明するのも，なかなか難しいものです。私たちの経験上，そんなときにとても役に立つのは，データの背後に想定している「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単なポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん出てきます]。そして，そのようなポンチ絵を描いたあとに，その描かれた因果構造が「あ・る・特・定・の・条・件・群・」を満たしているかどうかを相手と共同で検討していきます。多くの場合，その検討を通して「この相関関係は因果関係を示していると解釈してよいのか？」や「相関関係を因果関係として解釈するためには本来はどのようなデータが必要なのか？」といった本質的な問いについて，より明確かつ端的な議論ができるようになります。相関と因果と丸と矢印のはなしはじめてのバックドア基準林岳彦(国立環境研究所)･黒木学(統計数理研究所) [特集]因果推論現実の課題に答える統計学参考⽂献 | バックドア基準の解説原稿 (本⽇の元ネタ) 2016年6⽉発売「岩波データサイエンスvol. 3」因果推論特集号

参考⽂献 | バックドア基準の解説 (ガチ勢向け)

参考⽂献 | Pearlのやさしい本（昨年でた） Pearlが、⼀般向けに、やさしく書いている！（やさしく書かれているがけっこう深い／新しい内容まで書いてある）

参考⽂献 | 社会学者向け v IL Morgan and Winship (2014) 『Counterfactuals
and Causal Inference: Methods and Principles for Social Research』 (2nd ed.) DAGと潜在結果モデルのhybrid

(2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へパートIの⽬次 0. 序：因果と相関と「対象の多様なありよう」

I. 解題パートI：「構造」と「差分」の視点の統合「対象を理解すること」にとって統計的因果推論とは何か？⾮巡回有向グラフ(DAG) 潜在結果モデル構造的因果モデル 𝒀 =
𝑿𝒀𝟏 + (𝟏 − 𝑿)𝒀𝟎 X Y Z1 Z2 Z3 Average Causal Effect = 𝑬[𝒀𝟏] − 𝑬[𝒀𝟎] 𝑋: = 𝑔: 𝑝𝑎 𝑋: , 𝜀: 𝑖 = 1, … , 𝑝 「差異からみた因果」「構造からみた因果」

まず、個体レベルの因果効果を考える • 猫のノミの投薬治療の仮想例で考えていきますノミに感染している猫へのノミ駆除剤の効果の例ぴかそ「駆除剤なし」をX=なし、「駆除剤あり」をX=ありとする投薬により駆除までの⽇数Yを短くできるか？・
・ “ぴかそ”における駆除剤の投薬の因果効果を以下のように定義する “ぴかそ”に投薬した場合(X=1)の「ノミの駆除までの⽇数Y」 - “ぴかそ”に投薬しない場合(X=0)の「ノミの駆除までの⽇数Y」たとえば投薬しない場合Y=14⽇、投薬した場合Y=4⽇なら、投薬の因果効果は「-10⽇」となる

まず、個体レベルの因果効果を考えるこの差(-10⽇)が個体の因果効果の定義ぴかそ投薬⽇数Y 14⽇ 4⽇ ॲཧT ݸମiͷ
൓ԠYi ͳ͠ ͋Γ • 実はこの因果効果の値を観測することは不可能である “ぴかそ”に投薬した場合(X=あり)の「ノミの駆除までの⽇数Y」 - “ぴかそ”に投薬しない場合(X=なし)の「ノミの駆除までの⽇数Y」 X

まず、個体レベルの因果効果を考える • 実はこの因果効果の値を観測することは不可能である “ぴかそ”に投薬した場合(X=あり)の「ノミの駆除までの⽇数Y」 - “ぴかそ”に投薬しない場合(X=なし)の「ノミの駆除までの⽇数Y」同⼀の個体にはどちらか⼀⽅の処理しかできない原理的に反応の「差」は観測できない→因果効果は観測できない “因果推論の根本問題” ぴかそに投薬した場合（X=あり）
ぴかそに投薬した場合（X=なし）観測不可能 ↓ ↑ 観測不可能 ॲஔT ݸମiͷ ൓ԠYi ͳ͠ ͋Γ ॲஔT ݸମiͷ ൓ԠYi ͳ͠ ͋Γ ぴかそぴかそ 14⽇ 4⽇ X X

集団レベルの因果効果を考える ॲཧT ݸମiͷ ൓ԠYi ͳ͠ ͋Γ " # $ %
& ' " # $ % & ' この差が集団Aへの因果効果の定義個体A, B, C, D, E, Fからなる集団Aへの平均効果を考える • 個体ではなくて集団なら”根本問題”を回避できる？集団Aに投薬した場合(X=あり)の「ノミの駆除までの平均⽇数Y」 - 集団Aに投薬しない場合(X=なし)の「ノミの駆除までの平均⽇数Y」 X

集団レベルの因果効果を考える • 個体ではなくて集団なら”根本問題”を回避できる？集団Aに投薬した場合(X=あり)の「ノミの駆除までの平均⽇数Y」 - 集団Aに投薬しない場合(X=なし)の「ノミの駆除までの平均⽇数Y」実際の処理では各個体にどちらか特定の処理を割り付けることなる投薬なしのグループ（個体C, D, E)
投薬ありのグループ（個体A, B, D) ॲཧT ݸମiͷ ൓ԠYi ͳ͠ ͋Γ ॲཧT ͳ͠ ͋Γ " # $ % & ' " # $ % & ' " # $ % & ' " # $ % & ' " # $ % & ' 本来の因果効果観察された処理群間の差各処理グループに含まれる個体は同⼀ではない →集団への因果効果も原理的に観測できない X X

集団レベルの因果効果を考える • サブグループに分ければ”根本問題”を回避できる？集団A1に投薬した場合(X=あり)の「ノミの駆除までの平均⽇数Y」 - 集団A2に投薬しない場合(X=なし)の「ノミの駆除までの平均⽇数Y」集団A 投薬なし（X=なし）のサブグループ（集団A1）投薬あり（X=あり）のサブグループ
（集団A2）ではどうしたら良いか？平均⽇数Yを観測平均⽇数Yを観測この差は観測可能であるがサブグループ間での「投薬の有無による差」と「背景因⼦の差」が混ざってしまっていて区別がつかない状況を潜在反応モデルで整理してみよう

潜在結果モデルという枠組み • 処置（投薬）×反応（⽇数）の組合せを整理してみる X=無のサブグループ X=有のサブグループもしX=無のときの反応 (i)の「駆除までの⽇数」 (ii)の「駆除までの⽇数」
もしX=有のときの反応 (iii)の「駆除までの⽇数」 (iv)の「駆除までの⽇数」＠現実世界＠反事実的可能世界＠反事実的可能世界＠反事実的可能世界因果推論とはでの反応と＠現実世界観測可能なでの反応の「差」の計算＠現実世界観測不可能な＠反事実的可能世界の世界も扱える枠組みがほしい！

潜在結果モデルという枠組み • Rubinの潜在結果モデルの考え⽅処理Tに対して、各個体𝑖は⼀意な（決定論的に定まる）潜在結果𝑌(𝑖)!"($)をもつ 𝒀(ぴかそ)𝐢𝐟(𝑿% ) ぴかそだりもしも「ぴかそ」が
「駆除剤あり」のときの「⽇数」の潜在反応ノミに感染している猫へのノミ駆除剤の効果の例「駆除剤なし」をX=無、「駆除剤あり」をX=有、「駆除までの⽇数」をYとする 𝒀(だり)𝐢𝐟(𝑿% ) もしも「だり」が「駆除剤なし」のときの「⽇数」の潜在反応有無＊このifを明⽰する表記法は⼀般的ではないが分かりやすさ優先して本⽇はこれを使⽤

潜在結果モデルという枠組み • このモデルの何が嬉しいかと⾔うと、因果効果を「処理群間での潜在反応の差」として定式化できる潜在結果を⽤いた「ぴかそ」への投薬の因果効果の定義 𝒀 ぴかそ 𝐢𝐟(𝑿% ) −
𝒀 ぴかそ 𝐢𝐟(𝑿% ) ぴかそ現実世界内ではこの両者を同時に観測できない “因果推論の根本問題” 同じ個体に同時に異なる処理はできない有無＊猫の名前が「しゅれーでぃんがー」の場合は別途要検討

࣮ࡍͷॲஔT જࡏ൓Ԡ Y(i) if(T=0) if(T=1) Y(i) if(T) Y
潜在結果モデルという枠組み • 潜在モデルの枠組みを⽤いると、”因果推論の根本問題”を「⽋測」の枠組みで捉えることができる Y (i)if(T=0) if(T=1) ɿݸମi ʹॲཧT=0Λ༩͑ͨͱ͖ͷજࡏ൓Ԡ ɿݸମi ʹॲཧT =1Λ༩͑ͨͱ͖ͷજࡏ൓Ԡ Y (i) if(T=1) Y (i) Y (i)if(T=0) - ݸମJʹ͓͚ΔҼՌޮՌͷఆٛɿ この差が個体iの因果効果の定義ぴかそ投薬駆除までの⽇数 “⽋測” “⽋測” _ _ / 有無有無有無有無 X X X X X X X X X X 結果有無

潜在結果モデルという枠組み • ねこ集団Aへの「平均因果効果」を潜在反応を⽤いて定義すると： 𝑬[𝒀 集団𝑨 𝐢𝐟(𝑿% )] − 𝑬[𝒀(集団𝑨)
𝐢𝐟(𝑿% )] 集団レベルでもこの両者は同時に観測できない “因果推論の根本問題” 有無

潜在結果モデルという枠組み • 何を知る必要があるのかを潜在反応モデルの枠組みでもういちど整理してみる計算したいのは（たとえば）因果効果 (iv) – (ii) Average Treatment
Effect of the Treated (ATT) X=無のサブグループ X=有のサブグループ X=無の潜在反応 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] X=有の潜在反応 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] 𝑬[𝒀 集団𝑨|𝑿 = 𝐢𝐟(𝑿) )] そもそも観測不能（反事実）そもそも観測不能（反事実）観測可能観測可能 (i) (ii) (iii) (iv) けれども、(ii)は反事実なので観測＆計算できない！反事実項の値を知るにはどうすればよい？無無有有無無有有

潜在結果モデルからみる無作為化 • 解決策：無作為化により反事実項を観察項で代替 X=無のサブグループ X=有のサブグループ X=無の潜在反応 𝑬[𝒀 集団𝑨|𝑿 =
𝟎 𝐢𝐟(𝑿)𝟎)] 𝑬[𝒀 集団𝑨|𝑿 = 𝟏 𝐢𝐟(𝑿)𝟎)] X=有の潜在反応 𝑬[𝒀 集団𝑨|𝑿 = 𝟎 𝐢𝐟(𝑿)𝟏)] 𝑬[𝒀 集団𝑨|𝑿 = 𝟏 𝐢𝐟(𝑿)𝟏)] そもそも観測不能（反事実）そもそも観測不能（反事実）観測可能観測可能 (i) (ii) (iii) (iv) サンプル集団処理を無作為に割付因果効果 (iv) – (ii) を (iv) – (i) として計算可能無作為割付→サブグループの間で背景因⼦が揃うと期待できる = 反事実である(ii)を観察可能な(i)で代替可能「同じ集団」ではないが「⼗分に似た集団」として =

潜在結果モデルから⾒る無作為化 • 同じこと違う表現でもういちど説明すると： 𝑬[𝒀 集団𝑨 𝐢𝐟(𝑿A𝟏)] − 𝑬[𝒀(集団𝑨) 𝐢𝐟(𝑿A𝟎)] 同⼀の集団に異なる処理を与えることはできない
𝑬[𝒀 集団𝑨 𝐢𝐟 𝑿)𝟏 |𝑿 = 𝟏] − 𝑬[𝒀(集団𝑨) 𝐢𝐟 𝑿)𝟎 |𝑿 = 𝟎] 無作為に（たとえばコイン投げで）処理Tを割り付ける潜在反応モデルによる集団Aへの因果効果の定義「同⼀ではないけど⼗分に背景が揃っている集団」に「異なる処理X=0/X=1」を与えることができる＝因果効果の定義に⼗分に近い値を推定できると期待できる

補⾜｜傾向スコア法 X=0を受けた群 X=1を受けた群 X=0の潜在反応 𝑬[𝒀𝟎 ねこ集団𝑨|𝑿 = 𝟎 ]
𝑬[𝒀𝟎 ねこ集団𝑨|𝑿 = 𝟏 ] X=1の潜在反応 𝑬[𝒀𝟏 ねこ集団𝑨|𝑿 = 𝟎 ] 𝑬[𝒀𝟏 ねこ集団𝑨|𝑿 = 𝟏 ] 共変量の分布そもそも観測不能（反事実）そもそも観測不能（反事実）観測可能観測可能 (i) (ii) (iii) (iv) = = 潜在反応と処理Xが条件付き独⽴→ 𝑌'(()) 𝑋 | 𝑒 ⊥ ⊥ eでマッチング・重みづけ傾向スコアe 共変量両群での共変量の分布のインバランスをpost-hocに補正するためのバランシングスコアeを共変量から計算する因果効果 (iv) – (ii) を (iv) – (i) として計算可能条件付き無視可能性条件

の条件を満たすことで、観察値に基づき「反事実」の項も計算可能（尚、バックドア基準を満たせば上記条件は満たされる）潜在反応モデルと関数的因果モデル｜ Rubinの潜在結果モデルの特徴（まとめ）因果効果を「異なる処理に対する潜在結果の差分」として定義する因果効果の定義式には「反事実」の項が含まれる 𝑌!"($) 𝑋|𝑍
⊥ ⊥ 潜在反応の中⾝（”why it works”）はブラックボックスでも構わない＊潜在反応がブラックボックスであるのは理論的な必然というわけではない（次の話につづく）尚、処理Xが連続量のときの表現が苦⼿という側⾯もある中⾝に関わらず適⽤できるので「推定プロトコル」への⾒通しがよいたとえばRCTとか傾向スコアなどで

(2) 潜在結果モデルのSCMによる表現 (3) 潜在結果モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へパートIの⽬次 0. 序：因果と相関と「対象の多様なありよう」

参考⽂献｜⿊⽊（2017）ここからの話はこの本の第六章が元ネタです本⽇の説明はやや「超訳」的になりますので正確な議論についてはぜひ本書をご参照ください

因果グラフと関数的因果モデル｜構造的因果モデルSCM（a.k.a.関数因果モデル）とは因果構造を関数の親⼦関係の連なりの形で記述したもの関数因果モデルのフォーマルな定義⾮巡回的有向グラフGとその頂点に対応する確率変数の集合V = {X1,…Xp} が与えられている．グラフGが確率変数間の関数関係を⿊⽊(2017), p70より引⽤
になる形に規定し、確率変数がこの関数関係にしたがって⾃律的でかつ定常的に⽣成されるとき、Gを因果ダイアグラムという．ここに、錯乱項ε1,…,εpは互いに独⽴であるとする．また、pa(Xi)は因果ダイアグラムG におけるXiの親全体からなる変数集合であり、GにおけるXiの直接的原因 (direct cause)と解釈される．上式を広い意味で物理的なデータ⽣成過程のモデルとして捉えるとき、上式は関数因果モデルあるいは、構造⽅程式モデル、構造的因果モデルと呼ばれる. 𝑋! = 𝑔! 𝑝𝑎 𝑋! , 𝜀! 𝑖 = 1, … , 𝑝 これは等式というより代⼊式ベイジアンネットワークとは異なり「因果」概念を内包する Structural Causal Model

因果グラフと関数的因果モデル｜構造的因果モデル（SCM）とは因果ダイアグラムはSCMの視覚的表現といえる（実は後者の⽅が表現できるものの幅は広い）因果構造を関数の親⼦関係で記述したもの GUIとCUIのようなイメージ（CUIが本体） Y X Z1 Z2
Z3 特定の関数型を特に念頭に置く話ではない 𝑌 = 𝑔" (𝑋, 𝑍1) 𝑋 = 𝑔# (𝑍2, 𝑍3) 𝑍1 = 𝑔$% (𝑍2) 𝑌 = ℎ" (𝑍2, 𝑍3) 実は「Pearlの体系=グラフィカルモデル」というのは適切な理解ではない！こうも書けるしこのように外⽣変数の関数としても書ける詳細は⿊⽊(2017) (錯乱項は省略）

1. 構造から⾒た因果推論：DAGとバックドア基準の⼊⾨ 2. 差分から⾒た因果推論：潜在反応モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現
(2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へパートIの⽬次

潜在反応モデルと関数的因果モデル｜潜在結果モデルを関数的因果モデルで表現する 𝑌'(())(ぴかそ) = 𝑓(𝑖𝑓(𝑋), 𝑍1, 𝑍2, 𝑍3, . .
, 𝑍𝑛) 「ぴかそ」の特性を表す全変数 𝑌'(()%*)(ぴかそ) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, . . , 𝑍𝑛) 𝑌'(()%+)(ぴかそ) = 𝑓(𝑋 = 1, 𝑍1, 𝑍2, . . , 𝑍𝑛) 潜在結果の”中⾝”を関数𝑓と変数𝑍で表現しているぴかそ潜在結果は概念的にはその個体がもつ諸特性の決定論的関数で表現できる 𝑖𝑓 𝑋 = 0, 𝑖𝑓 𝑋 = 1, 潜在結果の脱ブラックボックス化 SUTVA条件のより明⽰的な検討へ繋がる→パート2へ

潜在反応モデルと関数的因果モデル｜例えば全特性が近似的に等しい個体がいれば… 𝑌'(()%*)(たつや) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, 𝑍3,
. . , 𝑍𝑛) 𝑌'(()%*)(かずや) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛) もし「たつや」「かずや」という双⼦がいてもし関数𝑓および変数𝑍が近似的に等しければ 𝑌#$(&'() たつや − 𝑌#$(&'*) たつや ≒ 𝑌#$(&'() たつや − 𝑌#$(&'*) かずやこれは観測可能！「関数𝑓と特性𝑍」から識別可能性（バイアスのない因果効果の推定が可能か）を議論しうる観測不可能な因果効果少数事例研究がやってることはこれに近い？

潜在反応モデルと関数的因果モデル｜「たつや」が「かずや」と代替可能とは⼀体なにを意味しうるのか →第III部へ III. 法則性と固有性：EBM/EBPsにおける「（やや／概ね／完全に）断⽚的なもの」⼀般に統計解析／統計的因果推論はある種の”交換可能性”を想定しているが、現実にはどこまでいっても完全な代替などできない
＊可能世界と反事実と代替の（不）可能性を巡る物語の例 image

潜在反応モデルと関数因果モデルと因果グラフ｜集団Aへの平均因果効果を考える 𝐸[𝑌'(())(集団𝐴)] = 𝐸[𝑓(𝑖𝑓(𝑋), 𝑍1, 𝑍2, . . .
, 𝑍𝑛)] 平均因果効果＝𝐸[𝑌,-($).) ねこ集団𝐴 − 𝐸[𝑌,-($)/) ねこ集団𝐴 ] = 𝐸[𝑌,-($).) ねこ集団𝐴|𝑋 = 1 ] − 𝐸[𝑌,-($)/) ねこ集団𝐴|𝑋 = 0 ] 𝐸[𝑌:C(DA=) 集団𝐴|𝑋 = 1 ] = 𝐸[𝑓 𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛 𝑋 = 1 ] 𝐸[𝑌:C(DAE) 集団𝐴|𝑋 = 0 ] = 𝐸[𝑓(𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛|𝑋 = 0)] もし異なる処理Xを受けたサンプル集団間で関数fおよび特性Zの分布が同等とみなせる場合異なる処理を受けた集団間で潜在反応の分布が異ならない観測値から因果効果を計算可能

潜在反応モデルと関数因果モデルと因果グラフ｜「集団間（もしくは個体間）での関数fおよび特性Zの分布の同等性」構造的類似性特性的類似性⼀般に：潜在結果の類似性を決める⼆つの要素 𝑌'(()%,) 集団𝐴
= 𝑓(𝑖𝑓(𝑋 = 𝑥), 𝑍1, 𝑍2, . . , 𝑍𝑛) 𝑌'(()%,) 集団𝐵 = 𝑓(𝑖𝑓(𝑋 = 𝑥), 𝑍1, 𝑍2, . . , 𝑍𝑛) 両者が⼗分に近ければ集団Aの結果を集団Bの結果で代替できる（と⼀般に解釈される）

1. 構造から⾒た因果推論：DAGとバックドア基準の⼊⾨ 2. 差分から⾒た因果推論：潜在反応モデル⼊⾨ 3. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現
(2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり 4. 差分と構造の統合 --- Issueの総合的理解へパートIの⽬次

潜在反応モデルと関数因果モデルと因果グラフ｜潜在反応モデルをDAGで表現してみると畢竟、潜在反応モデルと関数因果モデルとバックドア基準の話はシームレスに繋がっている Y X Z1 Z2 Z3 バックドア基準に基づき、たとえばこの潜在反応モデ
ルの例で調整する必要があるのはZ1だけ潜在反応に実際のXの値が与えられて観測値Yとなる 𝑌'(()) 𝑌 = 𝑓 𝑌,-($), 𝑋 = 𝑋𝑌,-($).) + (1 − 𝑋)𝑌,-($)/) たとえばXが0/1のときはこう書ける 𝑌#$(&) = 𝑓(𝑖𝑓 𝑋 , 𝑍1, 𝑍3) 𝑌:C(D) 𝑋|𝑍1 ⊥ ⊥ 条件付き無視可能性

本⽇の内容 I. 構造から⾒た因果推論：DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論：潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1)
因果グラフのSCMによる表現 (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ

Y X Z1 Z2 Z3 𝑌 = 𝑔" (𝑋, 𝑍1)
𝑋 = 𝑔# (𝑍2, 𝑍3) 𝑍1 = 𝑔$% (𝑍2) 𝑌 = ℎ" (𝑍2, 𝑍3) こうも書けるしこうも書ける (1) 構造的因果モデルから帰納的／演繹的因果推論の全体を⾒る構造的因果モデルは⾮常に広いクラスのモデルを含む

構造的因果モデルから帰納的／演繹的因果推論の全体を⾒る 𝑌 = ℎ" (𝑍2, 𝑍3) こうも書けるこの形、⾮常に⼀般的である 𝑇𝐸𝑀𝑃 =
𝑚𝑎𝑖𝑛 (モデルパラメータベクトル) たとえばスパコンで回すような気候変動シミュレーションモデル（What if/反事実的計算に⽤いられる）もこんな形で書きうる構造的因果モデルは⾮常に広いクラスのモデルを含む

潜在反応モデルメカニズムがブラックボックスであるたぐいの物理シミュレーションモデル因果効果推定アプローチの連続的な理論観（私⾒）中間変数を介す２段階回帰
under フロントドア基準構造推定＠経済学 X以外の共変量をバランシングしていくたぐいの 𝑌 = 𝑓 (処理𝑋, 外⽣変数𝑧) 重回帰 under バックドア基準 RCT, 準実験例えばスパコンで回すような気候変動モデル関数fと変数zについてのモデル式の正当性に依存しないただし、関数fと変数zの理論がなければ移設可能性の把握が困難関数fと変数zについてのモデル式の正当性に依存する関数fと変数zの同等性の検討により移設可能性を議論可能祖先変数を介す操作変数・⼆段階SLS 構造的因果モデルから帰納的／演繹的因果推論の全体を⾒る Full-of-Model Model-free X→Yの祖先-⼦孫系列の効果伝搬を演繹計算・集計していくたぐいの

(2) 「Issueの総合的理解」における因果推論 ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔ 例：有機⽔銀汚染に対する環境リスク研究者の"頭の中” ޻৔Ͱͷ ੜ࢈աఔ
ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ “Issue/problem-driven”の解析者と、”Method- driven”の解析者の”頭の中”は異なる Issue-drivenの解析者の多くは常に頭の中に何らかの "因果モデル"をもつ

(2) 「Issueの総合的理解」における因果推論 150 どこに介⼊しうるのか／もし介⼊したらどうなるのかについてのアイデアが常に頭の中をぐるぐるしている ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔
޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ ⼯場の⽣産過程を変えれば有機⽔銀の⽣成を抑えられるのでは？排⽔処理を変えれば有機⽔銀を除去できるのでは？禁漁により⼈への曝露を防げるのは？浚渫により汚染を低減できるのでは？市場への流通を⽌めれば市⺠への曝露は防げるのでは？妊婦や⼦供などへの注意喚起によりハイリスクグループへの曝露を減らせるのでは？市場への流通を⽌めると⾃家消費により曝露が増えるかも？例：有機⽔銀汚染に対する環境リスク研究者の"頭の中”

「差異」と「構造」の繋がりが⾒えないと・・ 151 • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は？頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔
޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ （政策的対応を念頭においた）介⼊効果推定市場= 流通禁⽌市場= 流通あり市⺠の健康市⺠の健康ここの差分＝介⼊効果どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう

「差異」と「構造」の繋がりが⾒えないと・・ 152 • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は？頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔
޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ （政策的対応を念頭においた）介⼊効果推定市場= 流通禁⽌市場= 流通あり市⺠の健康市⺠の健康ここの差分＝介⼊効果どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう

153 両者にピントを合わせて思考できるようになってくる頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔ ޻৔Ͱͷ ੜ࢈աఔ
ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ （政策的規制措置等を念頭においた）介⼊効果推定 do(市場= 流通禁⽌） do(市場= 流通あり）市⺠の健康市⺠の健康ここの差分＝介⼊効果両者の関係が⾒えるぞ・・・！「差異」と「構造」の繋がりが⾒えてくると・・・

バックドア基準構造的因果モデルそのときふと⾃分の⾜元を⾒てみてみると・・両者にピントを合わせて思考できるように「差異」と「構造」の繋がりが⾒えてくると・・・ DAG

変数を概念的に吟味するとはどういうことか｜統計的因果推論と諸研究の関連性のイメージ因果モデル関数fと変数Zのありよう⾃体を分析対象とした質的/量的研究介⼊効果推定統計的
因果推論分析概念の／関数fと変数Zのモデルの⾼解像度化バイアスの減少 Target/SUTVAの明確化深化効果の定量的な実証量的な重要度の明確化介⼊効果がいかに／どの程度⽣じるかについての “Sufficiently deep explanation”を社会に提供できる Morgan and Winship (2014) 「差がありました」の先の「どうすればいいの？」に答えたい！例えば、個別ケースのプロセストレーシング

変数を概念的に吟味するとはどういうことか｜統計的因果推論で因果グラフを⽤いることの効⽤・調整すべき変数についての論理が得られる・量的（統計的）研究と質的研究の橋渡しとなりうる・調整すべき変数を絞り込むことができる・感度分析・媒介効果分析への橋渡しとなりうる
・調整すべき変数の抜け漏れを防げる・因果の図解⾃体が関係者とのやりとりに役⽴つ・移設可能性についての議論も深まりやすくなる（移設可能性は⽣成メカニズムの安定性や類似性にも⼤きく依存するため）・識別可能性の前提条件の成⽴を検証するための視覚化 “Assumptions visualization tool” ・結果・処理・共変量の変数の概念的妥当性の吟味に役⽴つ “Issueの総合的理解”への⾒通しが開きやすい

バックドア基準は、「バイアスのない因果効果推定」のためにはどの変数を考慮するべきかの理論的条件を背景にある因果構造を基に与えるパートIの話の全体まとめ ▪ 潜在反応モデルは「潜在反応の差分」として因果効果を定式化し、因果効果推定の解析プロトコルへの明瞭な⾒通しを与える ▪ 構造的因果モデルは⾮常に広いクラスの因果効果の
推定アプローチを包含しうるものであり、issueの総合的理解へ向けた統計的／理論的／理念的な枠組みの基盤となりうる→混合研究指向との親和性 ▪

導⼊｜統計的推測の主要な3⽬的（再掲）⽬的の分類やりたいことの内容事例のイメージ（⼤学の留年の例で）理念的な理想をなす解析法のイメージしばしば現実的な
解析法予測現在得られている情報から、将来／未知の値／状況を予測したい（要因への介⼊は伴わない場合）多数の変数の情報から、留年リスクの⾼い学⽣を⾒つけたい（→その後⽀援につなげるなど）機械学習回帰分析！説明要素間の関連性を説明したいなぜ学⽣が留年するかを説明したい（要因を探索し理解／対策につなげたい）フルスタックの構造⽅程式（含む因⼦分析等）回帰分析！因果／介⼊効果の推定ある特定の要因に介⼊したときの、ある特定の要因への効果を知りたい特定のプログラムの導⼊が留年を防⽌する効果を知りたいランダム化⽐較試験回帰分析！⼀⾒同じ「回帰分析」でも、⽬的に応じて係数の解釈のあり⽅も、重要となる仮定群も異なる（異論は認める）＊＊互いに排反な分類という意味ではないので注意 ↑ パート1では「因果効果の推定」が主テーマ ▪

解析法予測現在得られている情報から、将来／未知の値／状況を予測したい（要因への介⼊は伴わない場合）多数の変数の情報から、留年リスクの⾼い学⽣を⾒つけたい（→その後⽀援につなげるなど）機械学習回帰分析！説明要素間の関連性を説明したいなぜ学⽣が留年するかを説明したい（要因を探索し理解／対策につなげたい）フルスタックの構造⽅程式（含む因⼦分析等）回帰分析！因果／介⼊効果の推定ある特定の要因に介⼊したときの、ある特定の要因への効果を知りたい特定のプログラムの導⼊が留年を防⽌する効果を知りたいランダム化⽐較試験回帰分析！⼀⾒同じ「回帰分析」でも、⽬的に応じて係数の解釈のあり⽅も、重要となる仮定群も異なる（異論は認める）＊＊互いに排反な分類という意味ではないので注意 ↑ パート1では「因果効果の推定」が主テーマ ▪ 構造的因果モデルはこれらの⽅向性の異なる世界線を架橋しうる点が嬉しい

2. そのXは本当にXか：概念的妥当性を吟味する 3. その因果効果はどこまで”拡⼤解釈”できるかパートIIの⽬次・その1：媒介経路の観点から・その2：要因間の依存性の観点から・
その3：⽂脈依存性の観点から・その4：測定の観点から・ターゲット妥当性の分解 1. 可能世界への”チャネル”としてのSUTVA条件・事例：壊⾎病と”シトラス” ・事例：マシュマロテストの”拡⼤解釈”

SUTVA条件とは SUTVA条件の定義個体 i を特徴づける潜在的な結果{Yi(1), Yi(0)}が次の2条件を満⾜するとき、それはSUTVA（Stable Unit Treatment Value
Assumption）条件を満⾜するという岩崎学『統計的因果推論』, p78より引⽤（表記法を⼀部編集） ▪ Rubinの潜在結果モデルでの因果効果の定義はSUTVA条件を前提とする (a) 個体 i の潜在的な結果は、他の個体の受ける処置に依存しない (b) 個体 i に対する処置は1通りに定まる潜在結果を⽤いた「ぴかそ」への投薬Xの因果効果の定義 𝒀 ぴかそ 𝐢𝐟(𝑿% ) − 𝒀 ぴかそ 𝐢𝐟(𝑿% ) 有無 Stable Unit Treatment Value Assumption

(hidden versionsがあると) SUTVA条件にあてはまらない SUTVA条件とは ▪ 「個体 i に対する処置は1通りに定まる」とは？（no hidden
version of treatment） “処置＝ワクチン接種” アストラゼネカ？モデルナ？ “処置”を明確に定義できないので因果効果がill-definedになるシノファーム？スプートニクV？ファイザー？

SUTVA条件とは ▪ 「個体 i の潜在的な結果は、他の個体の受ける処置に依存しない」とは？例えば、他の個体のワクチンの効果はその個体の感染を防ぐだけではなく、（その個体がキャリアにならないことで）⾃分の感染も防ぐ効果をもつ「個体iの潜在的な結果が、他の個体の受ける処置に
依存する」→ 個体iへの処置の効果が⼀義に定まらない（他の個体が受けた処置によって⾃分の結果が変わるため） SUTVA条件にあてはまらない

SUTVA条件とは ▪ なぜSUTVA条件が重要なのか？個体i@反事実世界A どの反事実世界とのコントラストを取れば良い？内部機構を⼀切もたないRubinの潜在結果モデルの枠組みでは、ある特定の可能世界とのコントラストを取ること（なぜこの世界がその可能世界と接続されるのか）を正当化する内在的な論理がない
（観測不可能）個体i@この世界（観測可能） 𝒀 𝒊 個体i@反事実世界B 個体i@反事実世界C 個体i@反事実世界D 3ヶ⽉⽔を誰もやらず、花が枯れた世界林が⽔を毎⽇あげた世界？ or 林が⽔を⽉⼀であげた世界？ orトランプが毎⽇来⽇して⽔をあげた世界？

SUTVA条件とは ▪ “まずSTUVAあれ！” 個体i@この世界（観測不可能） “処置X”というチャネルが⼀意に定まることで特定の可能世界との
接続がdefineされる Stable Unit Treatment Value 𝒀 𝒊 𝐢𝐟(𝑿) 「なぜ」とかじゃなくて個体i@反事実世界A 個体i@反事実世界B 個体i@反事実世界C 個体i@反事実世界D （観測可能） 𝒀 𝒊 ⽔がなく、花が枯れた世界 X = 林が週⼀で⽔をあげる林が⽔を週⼀で⽔をあげた世界 Rubinの潜在結果モデルではSUTVAが基底的な（それ以上その体系内では深掘りできない）仮定として要請される

SUTVA条件とは ▪ STUVA条件はどう吟味するのか “概念を質的に深掘りしていくこと”と因果効果推定の関係を考えてみる「概念に(hidden) multiple versionがない」かどうかを判断するには、ほんらい、質的なドメイン知識が必須である
Rubinの潜在結果モデルでは、その基底的な仮定の妥当性を質的知識に完全に外部化（丸投げ）している

その3：⽂脈依存性の観点から・その4：測定の観点から・ターゲット妥当性の分解 1. 可能世界への”チャネル”としてのSUTVA条件・事例：壊⾎病と”シトラス” ・事例：マシュマロテストの”拡⼤解釈”

概念の”質的”吟味：媒介経路の観点から薬の処⽅X→健康指標Yの因果効果は？ ▪ ॲํ9 ݈߁ ࢦඪ: いや、そもそも「処⽅」って何？ ॲํ9͋Γͳ͠ ΛϥϯμϜʹׂ෇
ॲํ9ͷҼՌޮՌΛ όΠΞεͳ͘ਪఆՄೳ

概念の”質的”吟味：媒介経路の観点から薬の処⽅X→健康指標Yの因果効果は？ ▪ ॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ 元々知りたいのは薬理作⽤の効果

概念の”質的”吟味：媒介経路の観点から ▪ ॲํ9 ݈߁ ࢦඪ: ෰ༀʹΑΔ ඃݧऀͷ ৺ཧతมԽ 「処⽅」には⼼理的効果もある
ʮϓϥηϘޮՌʯ 薬の処⽅X→健康指標Yの因果効果は？

概念の”質的”吟味：媒介経路の観点から ▪ ॲํ9 ݈߁ ࢦඪ: ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ ʮ؍࡯ऀޮՌʯ こちらの経路からの
⼼理的効果もありうる薬の処⽅X→健康指標Yの因果効果は？

概念の”質的”吟味：媒介経路の観点から ▪ ॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ ෰ༀͷ༗ແ 薬の処⽅X→健康指標Yの因果効果は？そもそも
「処⽅」しても「服薬」してないときもある ʮॲஔͷෆ९कʯ

概念の”質的”吟味：媒介経路の観点から ▪ 統合: 処⽅X→健康指標Yの「より”厚い”記述」 ॲํ9 ݈߁ ࢦඪ: ॲํ9͋Γͳ͠ ΛϥϯμϜʹׂ෇

概念の”質的”吟味：媒介経路の観点から ▪ ॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ ෰ༀͷ༗ແ ෰ༀʹΑΔ ඃݧऀͷ
৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 統合: 処⽅X→健康指標Yの「より”厚い”記述」 ແ࡞ҝׂ෇͞Εͨॲํ9ͷޮՌ͸ɺશͯͷ ഔհܦ࿏Λ૯߹ͨ͠஋Ͱ͋Δʢ㱠ༀཧޮՌͰ͸ͳ͍ʂʣ

概念の”質的”吟味：媒介経路の観点から ▪ ِༀPSຊༀ ͷॲํ9 ݈߁ ࢦඪ: ༀͷ੒෼ͷ ༀཧ࡞༻ ෰ༀͷ༗ແ ෰ༀʹΑΔ
ඃݧऀͷ ৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 薬理作⽤の因果効果を知るには？

ඃݧऀͷ ৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 薬理作⽤の因果効果を知るには？ શһ෰ༀ ९कͷపఈ ϒϥΠϯυʹΑΔ੾அ ϒϥΠϯυ ʹΑΔ੾அ

ඃݧऀͷ ৺ཧతมԽ ॲํʹΑΔ ؍࡯ऀͷ ৺ཧతมԽ 薬理作⽤の因果効果を知るには？ શһ෰ༀ ९कͷపఈ ղܾ๏ɿೋॏ໡ݕ๏ʴ९कͷపఈ

概念の”質的”吟味：媒介経路の観点から処置（処⽅）の概念的吟味で何が変わったか？ ▪ 最初は薬Aの影響を⾒る際に、無作為化された「薬の処⽅の有無」が「健康指標」に影響する単純な図式で捉えていた →「処⽅」が健康に与える影響が何に媒介されうるかを質的な知識に基づき吟味した →「処⽅」の概念的意味がより⾼い解像度で理解された →「処⽅の因果効果」は「薬Aの⽣理的作⽤による因果効果」と同義でないことが明⽰化された
→「薬の⽣理的作⽤による効果」以外の経路を遮断するという実験デザインの必要性が理解された →「本当に知りたい因果効果」にフォーカスするための具体的なデータ取得プロトコル（⼆重盲検法）が検討された「処理」概念と媒介経路の吟味により、因果効果の推定・解釈がより適切に実施できるようになった（質的知⾒による概念の吟味は重要）

SUTVAを考える：要因間の依存性の観点から効果の修飾：集団内での特性に応じて効果が異なる ▪ ༀ.ͷ ෰ༀ9 ೣͷ಺෼ൻ ࣬ױ,ͷ ࢦඪ: Φεೣʗ ϝεೣ
9ˠ:ͷฏۉҼՌޮՌ͸ ΄΅θϩͱਪఆ͞Εͨ ෰ༀ9ͷҼՌޮՌ͸ͳ͍ʁ ෰ༀ͸ແ࡞ҝʴೋॏ໡ݕ ˎԾ૝ͷྫͰ͢

SUTVAを考える：要因間の依存性の観点から効果の修飾：集団内での特性に応じて効果が異なる ▪ ༀ.ͷ ෰ༀ9 ࣬ױ,ͷ ࢦඪ: Φεೣ ༀ.ͷ ෰ༀ9
࣬ױ,ͷ ࢦඪ: ϝεೣ ૚ผʹղੳͯ͠ΈΔͱɾɾɾ ʮ9ˠ:ͷฏۉҼՌޮՌʯ͸ʮ9ˠ:ͷҼՌޮՌʯͷ͋ΓΑ͏Λ ͏·͘൓ө͍ͯ͠ͳ͍ʢz9ͷҼՌޮՌzͷ֓೦త༳Εʣ ͦ΋ͦ΋Φεೣʹ͓͚Δʮ࣬ױ,ʯͱϝεೣʹ͓͚Δʮ࣬ױ,ʯ͸ ྨࣅͷපଶΛ΋ͭผͷ࣬ױ͔΋ʁʢҼՌਪ࿦ˠ࣭త֓೦΁ͷϑΟʔυόοΫʣ ˎԾ૝ͷྫͰ͢

SUTVAを考える：要因間の依存性の観点から交互作⽤：処置後に決まる要因により効果が異なる ▪ ݈߁ ࢦඪ: ྍ๏$͋Γ ෰ༀ9 ʮ9ˠ:ͷҼՌޮՌʯ͸ྍ๏$ͷঢ়ଶʹ΋ґଘ͢Δ ʮ෰ༀ9ͷޮՌʯΛͲ͏ఆٛ͢Δ͔ʁ ʢͲͷੈքʹ͓͚ΔҼՌޮՌͳͷ͔ʹؔ͢Δෆఆੑ໰୊ͷ࠶೩ʣ
݈߁ ࢦඪ: ྍ๏$ͳ͠ ෰ༀ9 ˎԾ૝ͷྫͰ͢

SUTVAを考える：⽂脈依存性の観点から処置の⽂脈依存性の存在 ▪ 服薬Xの因果効果＝𝑌'( )% だだ − 𝑌'( )%
だだこれ、断薬の⽂脈でも同じ値になる？服薬あり服薬なし ʮ9ˠ:ͷҼՌޮՌʯ͸ॲஔ9ͷจ຺ʹ΋ґଘ͢Δ 他の例だと例えば、同じ教育プログラムのRCTでも、⾃発的参加と、謝⾦による参加と、強制参加の場合の処置効果は異なる場合など SUTVA条件により潜在結果は⼀義的な値を取ることが想定されているが、 0→1の効果と、1→0の効果は同じとは限らない

因果推論と「質的な研究」｜概念吟味の重要性の歴史的な例（壊⾎病） 1747年対照実験によりシトラスが船員の壊⾎病を防ぐ効果が確認シトラス→”酸味”→壊⾎病（の防⽌） Pearl and Mackenzie (2018)の記述に基づく
1800’s 英国海軍ではシトラス積載により壊⾎病は過去のものにしかしmediatorの取り違えにより悲劇が・・・シトラス→レモン→ライム→加熱濃縮ライムジュースへと代替されていった（代替のたびにビタミンが減っていく・・） 1900年前後の極地探検にて壊⾎病による死者が多発本当のmediatorはビタミンC 柑橘の効果⾃体が疑問視され無視されるように・・ ▪

因果推論と「質的な研究」｜ Pearl and Mackenzie (2018)の記述に基づくシトラス→”酸味”→壊⾎病（の防⽌）しかしmediatorの取り違えにより悲劇が・・・シトラス→レモン→ライム→加熱濃縮ライムジュースへと代替されていった（代替のたびにビタミンが減っていく・・）現実の系において”処置”の同⼀性の担保は必ずし
も簡単な話ではない e.g., RCTが⾏われた”意識の⾼い”学校と同⼀の ”処置”を普通の学校で実現できるのか？異なる対象／⽂脈における“処置”の同⼀性の担保は質的な理解度に依存する概念吟味の重要性の歴史的な例（壊⾎病） ▪

II.2 概念の吟味の⼩まとめ Rubinの因果モデルはSUTVA条件を所与の前提とすることで、理論的な定義と解析プロトコルの⾒通しを明確にしている⼀⽅、現実の系では(hidden) multiple versionsがあることは普通である、あるいは、概念の”厚い”記述への志向はSUTVA条件の成⽴の
難しさを明らかにしがち →この話は第IV部へつづく IV. さて、われわれは何を知りたいのか？〜筒井淳也(2019)『計量社会学と因果推論』を⼿がかりに「交絡要因の”キャンセルアウト”」の学問的含意を考える

その3：⽂脈依存性の観点から・その4：測定の観点から・ターゲット妥当性の分解 1. 可能世界への”チャネル”としてのSUTVA条件

解釈の”質的”吟味：ターゲット妥当性の分解「サンプル集団」と「ターゲット集団」の関係の類型 ▪ (A) サンプル元集団がターゲット集団 (B) サンプル元集団の中の⼀部の特性をもったサブ集団がターゲッ
ト集団 (C) サンプル元集団とは異なる集団がターゲット集団サンプル元集団＝ターゲット集団サンプル集団ターゲット妥当性＝サンプル集団の推定値をターゲット集団に適応することの妥当性（内的／⼀般化／外的妥当性等を包含する概念）サンプル元集団サンプル集団ターゲット集団サンプル元集団サンプル集団ターゲット集団⼀橋⼤⽣⼀橋⼤⽣⼀橋⼤⽣中の不登校リスク集団⼀橋⼤⽣ハーバード⼤⽣⼀橋⼤⽣ハーバード⼤⽣

解釈の”質的”吟味：ターゲット妥当性の分解 “⼀般化可能性”を巡るバイアスの分解と整理 ▪ サンプル元集団= ターゲット集団における真の因果効果サンプル集団における真の因果効果サンプル集団における処置群間の差
BIAS於サンプリング BIAS於⼀般化＝BIAS於サンプリング +BIAS於交絡サンプル元集団＝ターゲット集団サンプル集団⼀橋⼤⽣⼀橋⼤⽣ BIAS於交絡共変量はバランシングしているか？サンプリングはランダムか？

解釈の”質的”吟味：ターゲット妥当性の分解 “移設（外的）可能性”を巡るバイアスの分解と整理 ▪ サンプル元集団Gにおける真の因果効果サンプル集団における真の因果効果ターゲット集団Hにおける真の因果効果 BIAS於サンプリング@
集団G BIAS於移設＝BIAS於潜在結果 +BIAS於サンプリング +BIAS於交絡 BIAS於交絡 @集団G サンプル集団における処置群間の差サンプル元集団サンプル集団ターゲット集団ハーバード⼤⽣⼀橋⼤⽣ハーバード⼤⽣サンプリングはランダムか？共変量はバランシングしているか？ BIAS於移設@潜在結果潜在反応は代替可能か？「集団間（もしくは個体間）での関数fおよび特性Zの分布の同等性」構造的類似性特性的類似性

解釈の”質的”吟味：ターゲット妥当性の分解 “移設（外的）可能性”を巡るバイアスの分解と整理 ▪ サンプル元集団Gにおける真の因果効果サンプル集団における真の因果効果ターゲット集団Hにおける真の因果効果 BIAS於サンプリング@
集団G BIAS於移設＝BIAS於潜在結果 +BIAS於サンプリング +BIAS於交絡 BIAS於交絡 @集団G サンプル集団における処置群間の差サンプル元集団サンプル集団ターゲット集団ハーバード⼤⽣⼀橋⼤⽣ハーバード⼤⽣サンプリングはランダムか？共変量はバランシングしているか？ BIAS於移設@潜在結果潜在反応は代替可能か？「集団間（もしくは個体間）での関数fおよび特性Zの分布の同等性」構造的類似性特性的類似性ここのバイアスのチェックに関して”量的”のアドバンテージがどの程度あるかは実際問題としてかなり怪しいのではないか（c.f., RCT）

因果推論と「質的な研究」｜概念と移設可能性の吟味の重要性の例 Shoda et al. (1990) マシュマロ実験「マシュマロを⾷べるのを我慢できた（7分待てた）⼦／できなかった⼦」の⻑期追跡により、⼦供の”⾃制⼼（delay
of gratification）”が、その後の学業や社会⾏動における成功において重要であることを⽰唆した近年の追試的研究により、 - 概念解釈の妥当性 - 推定結果の移設可能性の両⾯において結論（の捉え⽅）が疑問視されてきている

因果推論と「質的な研究」｜概念と移設可能性の吟味の重要性の例 Watts et al. (2018)マシュマロ実験の再試験より⼤きくかつ多様なsample of childrenを調査より洗練された統計モデルを使⽤
Shodaらで⽰されていた”delay of gratification”と後のachievementの関係は社会経済的要因と認知能⼒で調整すると⼤幅に減少し、統計的調整⽅法により有意になったりならなったりする程度となった尚、Shodaらの研究はいわゆる「再現性が怪しい」という話とは少し違って、「研究／実験そのものの不備」ではなく（解釈はともかく結果⾃体には⼀定の再現性は認められる）、hypeがひどい（概念と移設可能性を真剣に吟味せずに⼀般書で広めた点がひどい）例と思われる ←マシュマロ・テストとその後続研究については森⼝（2021）に現在の知⾒がまとまっている

因果推論と「質的な研究」｜概念と移設可能性の吟味の重要性の例再試験では”最初の20秒”でほぼ決まっていた「測定しているのものは”何か”」「媒介しているものは”何か” 」を質的に吟味しないと解釈を誤りうる The relationship between delay
of gratification and academic achievement might be driven by the ability to generate useful metacognitive strategies that will influence self-regulation throughout one’s life. Shodaら (1990)での「7分待てること」の概念解釈 + 認知能⼒で調整すると効果量は⼤幅減測定されていたのは”そもそも何だった“のか？後続研究からむしろ「他者への信頼度」に近い指標であることが⽰唆されている

因果推論と「質的な研究」｜概念と移設可能性の吟味の重要性の例ターゲット妥当性の観点から Shodaらの研究ではサンプル元集団は⽐較的均⼀性が⾼い Shodaらの研究ではサンプル元集団は多様性ありの設計 ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ
BDIJFWFNFOU ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ BDIJFWFNFOU ଞऀ΁ͷ ৴པ౓ 4&4 എܠཁҼͷ ෼ࢄ͕খ͍͞ 移設可能性はかなり不明⽐較的に移設可能性の⾒通しあり作業的概念図の例

因果推論と「質的な研究」｜概念と移設可能性の吟味の重要性を⽰す事例マシュマロ実験の真の教訓は「われわれ研究者には”エビデンス”の安易な⼀般化への⾃制⼼がしばしば著しく⽋けている」という事実である概念と移設可能性の質的＆量的な吟味の不⼗分さにより、社会的・経済的要因の重要性を後景化し、⾃⼰責任論を強化しうる⽅向への解釈に陥っ
た感は否めないマシュマロ・テストから何を学ぶべきか？

II.3 “拡⼤解釈可能性”の⼩まとめターゲット妥当性＝＋サンプリングの妥当性＋共変量のバランシングの妥当性＋構造的類似性×特性分布の類似性構造＋特性的類似性が本質的な場合には量的分析のアドバンテージはあるのか？そもそも質的な知⾒がなければ類似性をみるための量的アプローチ⾃体が成⽴しなそうではある

パートIIの話の全体まとめ ▪ ▪ ▪ Rubinの因果モデルはSUTVA条件を所与の前提とすることで、理論的な定義と解析プロトコルの⾒通しを明確にしている⼀⽅、現実の系では(hidden) multiple versions
があることは普通である、あるいは、概念の”厚い”記述への志向はSUTVA条件の成⽴の難しさを明らかにしがち⼿元のサンプルからのターゲット妥当性を考える際に、構造＋特性的類似性が本質的な場合には量的分析のアドバンテージはあるのか？概念やターゲット妥当性の吟味に⽋けた量的分析はしばしば実害があるレベルで解釈を誤りうる

1. EBM/EBPsの「往路」と「復路」 2. EBM/EBPsにおける量的/質的の主従を考える：斎藤清⼆（2011,2012,2018）を⼿がかりにパートIIIの⽬次 Evidence-Based Medicine/ Evidence-Based Practices

因果推論と「質的な研究」｜ Evidence-Based Practicesの”往路”と”復路” 個人集団A 集団A’ 集団Σ 集団因果効果の推定量法則的（タイプ的）
個別的（トークン的） “往路” “復路” 論⽂を書くことを⽣業とする「研究者」という⼈種はしばしば”往路”までのことしか真剣に考えていない 𝛼, 𝛽, 𝛾 … エビデンスの⽣産個人個人エビデンスの利⽤ 𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 … トークンto タイプタイプto トークン研究者は”丘の上”で論⽂を書く復路では移設可能性／外的妥当性が問題となる

因果推論と「質的な研究」｜個人集団A 集団A’ 集団Σ 集団因果効果の推定量 “往路” “復路” 𝛼,
𝛽, 𝛾 … エビデンスの⽣産個人個人エビデンスの利⽤ 𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 … トークンto タイプ EBPsにおける「RCT最強論」の半可通性元ネタのEBMedicineは⼀定の⽣物学的⻫⼀性を想定しうる点で、EBPMと⼤きく異なる「往路最強」かもだが、その強みのモデルフリー性⾃体が”復路”での⼤きな脆弱性を⽣む＊ Cf., Deaton and Cartwright 2017 ⼀般にRCTの内部には異なる状況間の”距離”に対する情報が皆無 ? ? ? ? ?

因果推論と「質的な研究」｜質的な”⼿触り”の重要性：介⼊の⽂脈的な意味 𝑌D (ばんとらいん) = 𝑓(𝑋, 観測可能＆数量化可能なもの, 数量化不可能なもの, 観測不可能なもの, 固有なもの,
⾮固有なもの … ) そもそもを⾔えば、個体の潜在反応は観測可能なもの／不可能なもの、数量化可能なもの／不可能なもの／、固有なもの／⾮固有なものの全てによって規定されている観測可能＆数量化可能なもの以外の個体の諸々は ”往路”にて”誤差”として⽚付けられてしまう本当の「ばんとらいん」の全て半可通にとっての「ばんとらいん」ぼくの名前はばんとらいんばんとらいんにとって”ばんとらいんでないもの”は⼀つもないのに！

因果推論と「質的な研究」｜ 𝑌D ばんとらいん = 𝑓(𝑋, 𝐶1, 𝐶2, 𝐶3, 𝐶4, 𝐶5,
𝐶6, 𝐶7, 𝐶8, 𝐶9, 𝐶10 … ) 「（やや／概ね／完全に）断⽚的なもの」ばんとらいん X→Yの法則性を考える上で交絡要因として重要な特性（バックドア基準を満たす変数セット） (X→)Yの中範囲の⼀般性を考える上で⽂脈上重要な特性特定の⽂脈に回収されない特性 (X→)Yの固有性を考える上で⽂脈上重要な特性集団の因果効果の推定の観点からは “断⽚的なノイズ” 集団の因果効果の推定のために考慮が必要ばんとらいんにおけるX→Yの全体像はここの特性も全て関わる

𝐶6, 𝐶7, 𝐶8, 𝐶9, 𝐶10 … ) 「（やや／概ね／完全に）断⽚的なもの」ばんとらいん X→Yの法則性を考える上で交絡要因として重要な特性（バックドア基準を満たす変数セット） X→Yの中範囲の⼀般性を考える上で⽂脈上重要な特性特定の⽂脈に回収されない特性 Y→Xの固有性を考える上で⽂脈上重要な特性 RCTではX以外の全ての要因を “誤差”とみなす（断⽚的なノイズの集積）ばんとらいんの固有性はほぼ消去される

因果推論と「質的な研究」｜個人集団A 集団A’ 集団Σ 集団因果効果の推定量 “往路” “復路” 𝛼,
𝛽, 𝛾 … エビデンスの⽣産個人個人エビデンスの利⽤ 𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 … トークンto タイプタイプto トークン質的な”⼿触り”の重要性：介⼊の⽂脈的な意味例えばリスク・コミュニケーションの現場では「数値」のナラティブ内での位置づけまでの考慮が必要となる往路で”誤差”として⽚付けた「断⽚的なもの」に ”復路”でふたたび向き合うべきときがあるこういう感覚が分からない⼈をコミュニケーター役にすると⼤抵ろくなことにならない

斎藤清⼆（2011,2012,2018）のEBM/NBM論 ▪ 臨床⼼理学/内科学/⼼⾝医学の⽴場からエビデンスとナラティブの関係について⻑年論考が重ねられている斎藤(2011) ＊尚、林は⾃分のEBPM/リスクコミュケーションへの興味と重ねあわせて読んでます斎藤(2012=2016) 斎藤(2018) 会話形式で⼀⾒カジュアルだが、実は⼀番踏み込んだ議論をしてるかも
EBM+NBM論を⽐較的フォーマルに議論した内容 EBM+NBM、量的×質的論の現状での到達点

斎藤清⼆（2011,2012,2018）のEBM/NBM論 EBMの概念解釈の3類型（斎藤2012/松下2021より引⽤） ▪ 松下(2021)『⼼理療法における「エビデンス」とは何か』より引⽤ 1) EBM 正統派(批判的吟味派) EBM の定義と⽅法論を遵守する⽴場。エビデンスを疫学研究による経験的実証的情報と定義
し、EBM の本質をエビデンスおよびエビデンスを⽤いた臨床実践の批判的吟味におく。 2) ガイドライン派(グローバル・スタンダード派) エビデンスの定義は 1)と共通するが、EBM を「エビデンスに基づいた診療ガイドラインを作成し、それを医療実践に普及させること」と捉える⽴場。エビデンスの格付けを重視する。 3) 伝統科学派(病態⽣理派) エビデンスを臨床疫学的な情報に限定せず、⽣物化学的な理論や病態⽣理を推定する実験的研究の成果を重視しようとする⽴場。臨床実践が出発点 Treatment/治療法が出発点本来のEBMは1)であるが、残念ながら2)として喧伝されている場合が多い

斎藤清⼆（2011,2012,2018）のEBM/NBM論 Narrative-Based Medicineとは（斎藤2012=2016より） ▪ 『患者が主観的に体験する物語』を全⾯的に尊重し、医療者と患者との対話を通じて、新しい物語を共同構成していくことを重視する医療「病いを、患者の⼈⽣という⼤きな物語の中で展開する⼀つの『物語』であるとみなし、患者を『物語を語る主体』として尊重する⼀⽅で、医学的な疾患概念や治療法もあく
まで⼀つの『医療側の物語』と捉え、さらに治療とは両者の物語をすり合わせる中から『新たな物語』を作り出していくプロセスである、と考えるような医療」斎藤(2016) より引⽤（主張者の中でもグラデーションはあるが）基本的に解釈主義的な⽴場

斎藤清⼆（2011,2012,2018）のEBM/NBM論⼆重構造をもつ実践科学としてのEBMの構造+NBM ▪ エビデンスの⽣成プロセス厳密に統計的な実験デザイン論⽂化エビデンスの評価プロセス⽅法論的妥当性の吟味臨床的妥当性の吟味エビ
デンス EBMの実践プロセス患者の問題の定式化問題についての情報収集得られた情報の批判的吟味得られた情報の患者への適⽤これまでの実践の評価 NBMによる対話的臨床実践⽣成利⽤吟味吟味合法則的合理性合⽬的的合理性合⽬的的合理性実証主義的世界観解釈主義的世界観客観的に存在する疾患を治療/除去する≈ 患者の抱える「病いの物語」を編み直す＊この図は⻫藤(2018)を元に林が勝⼿にNBM部分を増築

斎藤清⼆（2011,2012,2018）のEBM/NBM論 EBMとNBMの調和/包含関係を考える ▪ 斎藤（2011）で⽰された３つの考え⽅の現状分類 ① EBMとNBMは相互に補完的であり、NBMを加えることによってEBMの体系は完成するという楽観的な考え⽅ ② EBMとNBMは異なる２つの世界観であるが、患者と医師の出会いの場⾯において共存しうるとする慎重な考え⽅
③ EBMとNBMは異なる２つの世界観であるが、患者と医師の対話の現場において、NBMはEBMを包摂／統合するという⼤胆な考え⽅ →⽇本の多くのEBMの専⾨家はこの考え⽅。臨床実践の実感に合う →NBMの主張者の⼤部分はこの考え⽅（認識論の違いに対して慎重） →斎藤(2011)の⽴場。EBMはそれ⾃体が「有効に活⽤すべき⼀つの物語」プラグマティズム的折衷／統合ともいえるかも斎藤(2011)は「ナラティブ三年エビ⼋年」、つまり、EBMをしっかりと勉強して理解した⼈はNBMをすぐ理解するとも書いている「偽権威」や「トンデモ医療」から患者を護るためにはEBMのしっかりした理解は必須

斎藤清⼆（2011,2012,2018）のEBM/NBM論（補⾜）権威主義との闘争としての初期EBM c.f., https://togetter.com/li/1746410 image

斎藤清⼆（2011,2012,2018）のEBM/NBM論（補⾜）権威主義との闘争としての初期EBM c.f., h<ps://toge<er.com/li/1746410 近藤誠外科医たちの権威主義的な癌治療実践権威を笠にきた苛烈な⼈格攻撃
闇落ち＊「ナラティブ三年エビ⼋年」を理解する上での背景のひとつ「海外の論⽂がどうした、今までこうしてたんだからいいんだ、俺の勘ではこうだからごちゃごちゃいうな」近藤⽒が最初期に⾔っていたことは今では「当たり前のこと」に海外の論⽂やエビデンスをもとにした批判

量的が”主”で、質的が”従”なのか？ ▪ 個別の”datum”によって”更新”されることで初めて完成されるのがEBPsであれば、量的が”従”で質的が“主”とも⾔えるのかも？階層ベイズ的なアナロジーで EBPsを“個別→法則→個別”の往復運動であるとするならば、法則的エビデンスは”事前分布（個体のデータが無い場合のデフォルト情報）”を提供するものとしてみなせるようにも⾒える
施策の有効性に関する法則的エビデンス個別の対話や（やや／概ね／完全に） ”断⽚的”な情報個別の施策・意思決定重み付け・更新前菜主菜 “事前分布” 個別の”datum”

III.のまとめ EBPsはしばしば「個別→法則→個別」の往復運動最後の「個別」こそ最終的な⽬的であるならば量的分析は”事前分布”を提供し、それを質的知⾒が”更新”する過程である、という⾒⽅もあり？ EBMとNBMの折衷／統合は、プラグマティズム（合⽬的性志向）の半ば必然的帰結であるやも？ “ナラティブ3年エビ8年”→(初期)EBMは既存の権威主義との闘争でもあったが、質的研究は「権威主義」や「トンデモ」とどう戦いうるのか？
▪ ▪ ▪ ▪ 良くも悪くも英語論⽂IF⾄上主義とエビデンスヒエラルキー的有効性評価体系が昭和的医学権威主義を打破した側⾯はある（それがまたある種のエビデンス／グローバル権威主義へと繋がるのはまた別の話として）。

統計学因果推論と社会学：筒井(2019)を元に筒井(2019）『計量社会学と因果推論』 ▪ ཧ࿦ͱํ๏ 34ר1߸ 2019೥਺ཧࣾձֶձ Sociological Theory and Methods
Vol.34 No.1 2019 Japanese Association for Mathematical Sociology ಛू࿦จ ܭྔࣾձֶͱҼՌਪ࿦ɿ ؍࡯σʔλʹج͍ͮͨࣾձͷཧղʹ޲͚ͯ ౵Ҫ ३໵ʢ໋ཱؗେֶʣ ʦཁ໿ʧ ౷ܭతҼՌਪ࿦͸ܭྔ෼ੳͷओྲྀͱͳ͍ͬͯΔ͕ɼܭྔࣾձֶʹ͓͚Δͦͷҙຯ΍Πϯ ύΫτʹ͍ͭͯମܥతʹ࿦ͨ͡ݚڀ͸͍·ͩʹগͳ͍ɽຊ࿦จͰ͸ɼҼՌਪ࿦ϞσϧΛؚ Ήܭྔ෼ੳͷख๏ʹ͍ͭͯɼҟ࣭ੑͱ͍͏֓೦Λ࣠ʹ੔ཧ͠ɼͦͷ্Ͱܭྔࣾձֶ͕ҟ࣭ ੑʹରͯ͠ଞͷ෼໺ͷख๏ͱ͸ҟͳͬͨΞϓϩʔνΛͱΔ܏޲͕͋Δ͜ͱΛࣔ͢ɽ͜ͷ͜ ͱ͸ɼϚϧνϨϕϧ෼ੳͱ΋ݺ͹ΕΔࠞ߹ޮՌϞσϧͷ׆༻ʹ͓͍ͯ໌Β͔Ͱ͋Δɽ͞Β ʹɼհೖ΍੾அΛ༻͍ΔҼՌਪ࿦ΞϓϩʔνͱɼཁҼؒͷؔ࿈ੑΛڧௐ͢Δܭྔࣾձֶత Ξϓϩʔνͷҧ͍Λઆ໌͠ɼͦΕ͕ਓʑͷ֓೦࿈ؔΛࢀর͢ΔࣾձֶͷಛੑͷݱΕͰ͋Δɼ ͱ͍͏͜ͱΛ࿦͡Δɽ

統計学因果推論と社会学：筒井(2019)を元に個体の異質性を巡る観点の違いの議論（筒井2019） ▪ ただ，ここではもうひとつのインプリケーションの⽅がより重要であると思われる.それは，計量社会学がいわゆるデモグラフィック要因(個体の異質性)に強い関⼼を払うがゆえに，個体の異質性の効果を除去することを⽬的とするルービン・モデルやその他の因果推論志向が強い⼿法を忌避したか，あるいは導⼊の必要性が強く意識されなかった，という可能性である(Xie 2007). 社会学で統計的因果推論⼿法の導⼊が起きていないことに関して:
筒井(2019)より引⽤)

統計学因果推論と社会学：筒井(2019)を元に混合効果モデルを軸に異質性への態度を議論 ▪ 以上のように，混合効果モデルの発想は，個体の異質性の効果を除去した上で固定効果の推定値を得るという⽅針とは逆に，固定効果の影響を除去した上で個体特有の効果の⼤きさを追究する，という点にある. 因果推論においては異質性がノイズであるのに対して，
混合効果モデルにおいては固定効果こそがノイズなのである. 混合効果モデルは y = X β + Zu + ε という基本形で表現できる.ここにおいて，Z は説明変数であり，たいてい X(切⽚を含む)の部分集合である.u は個体(クラスター)間の変量効果ベクトルであり，個体(クラスター)数× Z の⾏列である.ここで個体とは，データの最⼩単位が集合して作られる集まり(クラスター)を指す. ⽣徒個⼈が最⼩単位であるとき，その集まりである学級などが想定される. 混合効果モデルと固定効果モデルの⽐較の議論: 筒井(2019)より引⽤)

𝐶6, 𝐶7, 𝐶8, 𝐶9, 𝐶10 … ) 「（やや／概ね／完全に）断⽚的なもの」ばんとらいん X→Yの法則性を考える上で交絡要因として重要な特性（バックドア基準を満たす変数セット） (X→)Yの中範囲の⼀般性を考える上で⽂脈上重要な特性特定の⽂脈に回収されない特性 (X→)Yの固有性を考える上で⽂脈上重要な特性集団の因果効果の推定の観点からは “断⽚的なノイズ” 集団の因果効果の推定のために考慮が必要ばんとらいんにおけるX→Yの全体像はここの特性も全て関わる個体の異質性処置X （再掲スライド）固定効果

統計学因果推論と社会学：筒井(2019)を元にルービンの枠組みと「概念の厚み」 ▪ デモグラフィック変数が，少なくとも単純なかたちでは因果推論における「措置/ 介⼊」として考えにくくなるのは，さしあたりはそれが「動かない/動きにくい」からだと考えることができる.ただし，因果推論における介⼊の特徴は，それだけだと捉えられない，ということを強調しておきたい.というのは，しばしば注⽬さ
れる⾃⼰選択との違いが，個体内変動がないことだけでは説明できないからだ.より根本的な違いは，デモグラフィック変数が通常，介⼊変数と違って，《意味的な厚みのある概念を反映》した変数であるということにある.たとえば「学歴」について考えてみよう.学歴は，家庭的背景，能⼒，シグナル機能，アスピレーションなど，さまざまな概念との関連において有意味な要因として理解される.関連する要素(「他の条件」)をすべて剥ぎ取ってしまうと，もはや私たちは学歴という概念について理解することが難しくなる.というのは，パールの語彙を使うと，ある選択を介⼊として捉えるということは，因果ダイアグラムにおける「切除」を意味しているからだ. 因果推論の枠内においても，いわゆるメカニズムの分析においては，措置の効果の有意味な解釈が可能である.たとえば学歴を割当することは原理的には可能であるが，その結果の解釈においては，学歴と関連する概念(たとえば教育を通じて取得された能⼒やスキル)を考慮した上で，効果を及ぼすメカニズムの分析・解釈がなされることになる.他⽅で，ルービン・モデルを使⽤した場合，焦点を当てる要因が社会的なプロセスにおいてどのような重要性を持っているのかについては，全体的な推論や解釈を⾏うことはできなくなる. 筒井(2019)より引⽤)

統計学因果推論と社会学：筒井(2019)を元に社会学は何が知りたいのか？ ▪ 例外は，シエや⽯⽥が記録している，ダンカンが「遺産」として残したとされる⼀連の知⾒(Xie 2007; Goodman 2007)や，最近ではゴールドソープによる精⼒的な発信で
あろう.ダンカンは異質性こそが社会学の研究対象であると主張し(⽯⽥ 2012: 11)，異質性をノイズとして捉える因果推論とは距離を置いた.ゴールドソープは，(計量)社会学を population science として特徴づける.population science とは，統計データを通じて⼈⼝集団の規則性を確率論的に把握するものである 12) .ゴールドソープによれば，統計学的に発⾒された集団の規則性(たとえば出⽣率の低下)をもたらした諸原因について考察する際に，ルービンの potential outcomes アプローチの活動度が下がる(Goldthorpe 2016: 107). 筒井(2019)より引⽤観察データにおける変数は，それぞれ⼀定の「概念の厚み」を持っている.これと対局なのが実験における介⼊で，介⼊は⽂脈から切断された操作として，概念的には空洞であっても実施し，結果を観察することができる.もちろん，観察のレベルにおいても外⽣性のショックや制度的な断絶におけるように，⽂脈からの切断は⽣じる.むしろ，だからこそ因果推論ではこれらのショックや切断を⾃然実験として，介⼊の代わりに⽤いるのである.他⽅で，社会的なプロセスの記述や理解は，通常はこういった断絶を含まない，要因間の関連を想定してなされる.その意味で，社会的プロセスの記述が社会学的な課題であるとすれば，それは観察データに基づいて⾏われるしかない.

統計学因果推論と社会学：筒井(2019)を元に研究課題に対する依存性 ▪ ただし，要素間の連関と断絶とは，そのあいだにグラデーションを含んだものであり，ある要因の概念をどこまで分節化するのかは，当該概念の⼀般的理解のみならず，研究課題に依存する.たとえば「学歴」と関連する要素(家庭的背景，アスピレーション，能⼒，シグナリング等々)を切り離していき，学歴の⼀般的な概
念理解を掘り崩すに⾄ったとしても，介⼊プログラムとしてそれが有意味である場合には，問題がない.あるいは観察データの分析において，出⾝家庭要因を切り離した上で学歴による違いをみるといった場合，進学が⾃⼰選択であることを勘案しても，出⾝家庭要因とは独⽴した学歴の影響の⼤きさをある程度推察することができる.肝⼼なのは，因果の捉え⽅の⽔準にそった分析を⾏うことである. 筒井(2019)より引⽤

ҼՌޮՌਪఆͷجຊతͳߟ͑ํʢ౵Ҫ͔Βͷ຋Ҋʣ 9 : ; 9 : ; ここの関係だけ⾒たい！（それ以外はキャンセルしたい）ランダム化
均⼀化統計学的調整学歴（⼤学）親の社会階層収⼊『計量社会学と因果推論』統計学因果推論と社会学：筒井(2019)を元に

ࣾձֶͰͷߟ͑ํʢ౵Ҫ͔Βͷ຋Ҋʣ 9 : ; 9 : ; 社会学はここまでスコープに⼊れてナンボでしょ
Zの存在をキャンセルするのはないわー収⼊親の社会階層学歴（⼤学） →より”説明”志向の⼿法選択『計量社会学と因果推論』統計学因果推論と社会学：筒井(2019)を元に安易に“キャンセル”してはいけないものがあるのでは

因果推論と「質的な研究」｜概念と移設可能性の吟味の重要性の例ターゲット妥当性の観点から Shodaらの研究ではサンプル元集団は⽐較的均⼀性が⾼い Shodaらの研究ではサンプル元集団は多様性ありの設計 ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ
BDIJFWFNFOU ଌఆ͞Εͨ l੍ࣗ৺z ޙͷ BDIJFWFNFOU ଞऀ΁ͷ ৴པ౓ 4&4 എܠཁҼͷ ෼ࢄ͕খ͍͞ 移設可能性はかなり不明⽐較的に移設可能性の⾒通しあり作業的概念図の例（再掲スライド）

因果推論と「質的な研究」｜概念と移設可能性の吟味の重要性を⽰す事例マシュマロ実験の真の教訓は「われわれ研究者には”エビデンス”の安易な⼀般化への⾃制⼼がしばしば著しく⽋けている」という事実である概念と移設可能性の質的＆量的な吟味の不⼗分さにより、社会的・経済的要因の重要性を後景化し、⾃⼰責任論を強化しうる⽅向への解釈に陥っ
た感は否めないマシュマロ・テストから何を学ぶべきか？ ֶज़ํ๏࿦తzΩϟϯηϧzͷةݥੑ （再掲スライド）

因果推論のはじまりの場所｜初⼼に戻り「対象のありよう」を丁寧に考える 10個のリンゴがあります統計の教科書が想定してる「ありよう」は Exchangeable! （再掲スライド）

因果推論のはじまりの場所｜因果推論でまず重要なのは「対象集団のありよう」について丁寧に省察することであるある意味、統計的因果推論とは集団内の異質性／⾮均⼀性を巡る体系である（後述）「ありよう」の質的な省察は推論の⼟台をなす Exchangeable? （再掲スライド）

解析法予測現在得られている情報から、将来／未知の値／状況を予測したい（要因への介⼊は伴わない場合）多数の変数の情報から、留年リスクの⾼い学⽣を⾒つけたい（→その後⽀援につなげるなど）機械学習回帰分析！説明要素間の関連性を説明したいなぜ学⽣が留年するかを説明したい（要因を探索し理解／対策につなげたい）フルスタックの構造⽅程式（含む因⼦分析等）回帰分析！因果／介⼊効果の推定ある特定の要因に介⼊したときの、ある特定の要因への効果を知りたい特定のプログラムの導⼊が留年を防⽌する効果を知りたいランダム化⽐較試験回帰分析！（異論は認める）＊＊互いに排反な分類という意味ではないので注意パート1では「因果効果の推定」が主テーマ ▪ 構造的因果モデルはこれらの⽅向性の異なる世界線を架橋しうる点が嬉しい ʮհೖޮՌʯͱʮઆ໌ʯ͕੾Εͯ ͠·͏͜ͱͷةݥੑ （再掲スライド）

「説明モデルの良さ」の基準は明確ではないところがどうしても残る実態としては、分野内で蓄積されてきた既存知⾒とのある種のcoherencyにより評価されているところもありありようの「説明／分析」につきまとう悩み ▪ ⼀⽅、Rubinの因果モデルはSUTVA条件を所与の前提とすることで、理論的な定義と解析プロトコルの⾒通しを明確にしている
査読共同体の中で、何をしたら何が⽰されたことになるかのコンセンサスが明確である（そうした中で研究を蓄積していくことのメリットはそれはそれとして⾊々とあるだろう）統計学因果推論と社会学：筒井(2019)を元に

IV.のまとめ「ありよう」の質的な省察は推論の⼟台をなす背景要因をキャンセルアウト背景要因との関連や “（やや／概ね／完全に）断⽚的なもの”⾃体が興味の対象尚、近年はRubin系の因果推論でも異質性への関⼼が⾼まっているが、主にマーケティング的な関⼼であり固有性に対する興味／リスペクトなどは基本的に無い
さて、われわれは何を知りたいのか？

統計的因果推論のフレームワークとはいかなるものかを理解することで統計的因果推論がいかに質的な知⾒を（しばしば暗黙に）その基盤としているか統計的因果推論のスコープがしばしばいかに”狭い＆薄い”のかを議論したい本⽇のねらい（再掲スライド）

• 統計的因果推論では陰に陽に対象についての質的な知⾒をその基盤としており、その概念的および構造的仮定の質的な吟味は重要である全体のまとめ・雑感 • 潜在結果モデルは「潜在結果の差分」として因果効果を定式化し、因果効果推定の解析プロトコルへの明瞭な⾒通しを与える •
構造的因果モデルはissueの総合的理解へ向けた統計的／理論的／理念的な枠組みの基盤となりうる • EBPsはしばしば「固有→法則→固有」の往復運動であり、合⽬的的合理性の追求は半ば必然的に量的・質的の統合を指向するのでは？ • 統計的因果推論における⽅法論的”キャンセル”の学術的含意と（その裏⾯の「説明」の学術的捉えがたさ）をどう考えるか

「学術的に理解する」ってどういうこと? ：統計的因果推論のフレームワークから見た ...

「学術的に理解する」ってどういうこと? ：統計的因果推論のフレームワークから見た 「量的×質的」に関する眺望の (いささかとっちらかった)スケッチを共有する

More Decks by takehikoihayashi

Other Decks in Research

Featured

Transcript

「学術的に理解する」ってどういうこと? ：統計的因果推論のフレームワークから見た「量的×質的」に関する眺望の (いささかとっちらかった)スケッチを共有する