Slide 1

Slide 1 text

0 観察研究における因果推論 2024-10-04 第105回NearMe技術勉強会 ⽯原爽⼀朗

Slide 2

Slide 2 text

1 これまでの因果推論 第49回NearMe 技術勉強会

Slide 3

Slide 3 text

2 これまでの因果推論 第49回NearMe 技術勉強会

Slide 4

Slide 4 text

3 これまでの因果推論 第49回NearMe 技術勉強会

Slide 5

Slide 5 text

4 Goal ● 介⼊ができない(観察研究)因果推論でもができるようにしよう! ● 観察研究 ○ 処置の割り当てメカニズムが未知 & 研究者によってコントロールできない ○ = 介⼊を⾏うことができない

Slide 6

Slide 6 text

5 ⽂献 Imbens GW, Rubin DB. Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction. Cambridge University Press; 2015. 邦訳インベンス、G. W. & ルービン、D. B. (2023). インベンス・ルービン統計的因果 推論上下. 朝倉書店. 邦訳 Pearl, J., Glymour, M., Jewell, N. P. (著), (2019). 入門 統計的因果推論 . 朝倉書店 2,3章: 有向非巡回グラフ・バックドアパス 1章: 潜在的結果フレームワーク 3, 12章: 割り当てメカニズム

Slide 7

Slide 7 text

6 ⽬次 ● introduction ● 潜在的結果フレームワーク ○ 処置, 潜在的結果 ○ 処置割り当てメカニズム ● 有向⾮巡回グラフ ○ バックドアパス ○ 傾向スコア ● 事例

Slide 8

Slide 8 text

7 Introduction: 統計的因果推論とは何か? ● 統計的因果推論 = 反実仮想についての推論 ● 例 ○ 政策介⼊ ■ もし奨学⾦⽀援制度を開始は進学率を⾼めるか? ○ 政治制度の経路依存効果 ■ もしある地域で奴隷制が存在しなければ経済発展したか? ○ 資源の呪い ■ もしある国で⽯油が算出されなかったら⺠主化したか?

Slide 9

Slide 9 text

8 潜在的結果フレームワーク ● 反実仮想の因果推論に必要なフレームワーク ○ 介⼊研究(無作為化実験)と観察研究に共通するデザインを可能にする ● 構成要素 ○ 処置,潜在的結果 ○ 処置割り当てメカニズム

Slide 10

Slide 10 text

9 処置, 潜在的結果 ● 処置 (treatment) ● 潜在的結果 (potential outcome) ○ ユニットiで処置dを受けた場合に実現する結果 ● 観察される結果 (observed outcome) ○ ユニットiで観察される結果 潜在的結果は確率変数でない(fixed)

Slide 11

Slide 11 text

10 処置, 潜在的結果 処置効果 ● 因果効果 ユニット処置効果 ○ 根本的問題 ■ 問題⼆つの潜在的結果は同時に観測できない ■ Y(1)とY(0)は同時に観察することができないため追加の仮定なしに因果効果を 求めることは不可能

Slide 12

Slide 12 text

11 処置, 潜在的結果 識別 ● 識別のための⼆つの条件 ● 操作可能性 ○ 処置 Di =d を研究者が操作することができれば ○ = 研究者が処置を決定することができれば識別可能 ● 識別のための仮定 SUTVA(Stable Unit Treatment Value Assumption) ○ No interference between units ○ Consistency ■ どのユニットに対しても処置が同じ

Slide 13

Slide 13 text

12 処置, 潜在的結果 平均処置効果 ● 平均処置効果(ATE: Average Treatment Effect) ● ATT: Average Treatment Effect on the treated ● selection bias: 割り当てメカニズムを考慮しないと? ○ 何も考えず、処置群Di=1と対照群Di=0の平均の差を計算する selection bias ATT

Slide 14

Slide 14 text

13 処置割り当てメカニズム 無作為化実験 ● 無作為化実験 ○ 処置を無作為化することでセレクションバイアスを解消する が0

Slide 15

Slide 15 text

14 処置割り当てメカニズム 観察研究へ ● 無作為化実験を⾏ったかのように観察研究を⾏う ● 観察されるデータが複雑な無作為化実験によってあられたと考える ● 処置割り当てメカニズムが失われ、復元することを⽬指す ○ 具体的には共変量Xから処置割り当てメカニズムを想定する

Slide 16

Slide 16 text

15 処置割り当てメカニズム 正則な割り当て ● 定義: Regular Assignment Mechanism ○ individualistic: ■ 処置割り当て確率が他のユニットの潜在的結果‧共変量と独⽴ ○ probabilistic: ■ どのユニットも処置割り当て確率が0か1ではない ○ Uncorfounded: ■ 処置割り当て確率は潜在的結果と独⽴

Slide 17

Slide 17 text

16 処置割り当てメカニズム 観察研究でのATE推定 ● 処置割り当てメカニズムに基づくATE推定

Slide 18

Slide 18 text

17 処置割り当てメカニズム 傾向スコア ● 共変量が多すぎる...  → 次元の呪い ○ 共変量が多次元になるほど同じ層のユニット数が極端に減少 ○ 傾向スコア(propensity score)で低次元圧縮 ● マッチング ○ 処置群と統制群から「そっくりな」ユニットをペアにしてその結果の差を平均する ○ 次元圧縮した傾向スコアでも⾏うことができる ※傾向スコアでのマッチングは推奨されない King, Gary and Richard Nielsen. 2019. “Why Propensity Scores Should Not Be Used for Matching.” Political Analysis 27(4): 435–454.

Slide 19

Slide 19 text

18 処置割り当てメカニズム: まとめ 特徴 無作為化実験 良い観察研究 良くない観察研究 処置と共変量の区別 明確 明確 区別されていない Quantities of interest 明確 明確 不明確 処置の割当 無作為割当 無作為割当と想定可能 割当メカニズムを無視

Slide 20

Slide 20 text

19 有向⾮巡回グラフ(Directed Acyclic Graph) ● 有向⾮巡回グラフ(DAG: Directed Acyclic Graph) ○ 因果関係をグラフで表す(構造的因果モデル: SCM) ○ ここでは有向で⾮巡回のグラフを想定する ○ 後ページでは変数を条件づけると連鎖経路‧分岐経路では変数間が独⽴に、合流経 路では従属になることを⽰す ○ ● 例 たばこと肺炎 D: 喫煙 Y: 肺がん X: 遺伝子

Slide 21

Slide 21 text

20 有向⾮巡回グラフ(Directed Acyclic Graph): 分岐経路 ● Y, DはZに従属 ○ p(Y, D, Z) = p(Y|Z) p(D|Z) p(Z) ● D, YはZの条件の下で独⽴ ○ p(Y, D| Z) = p(Y, D, Z) /p(Z) = p(Y|Z) p(D|Z) p(Z)/p(Z) = p(Y|Z) p(D|Z) Z Y D

Slide 22

Slide 22 text

21 有向⾮巡回グラフ(Directed Acyclic Graph): 連鎖経路 ● YはZ,Xに従属、ZはXに従属 ○ p(Y, D, Z) = p(Y|Z) p(Z|D) p(D) ● 連鎖経路ではZの条件下でDとYは独⽴ ○ P(Y, D|Z) = P(Y, D, Z)/P(Z) = p(Y|Z) p(Z|D) p(D)/P(Z) = p(Y|Z) p(D|Z) Z Y D

Slide 23

Slide 23 text

22 有向⾮巡回グラフ(Directed Acyclic Graph): 合流経路 ● ZはY, D に従属 ○ p(Y, D, Z) = p(Z|Y, D)p(Y)p(D) ● Y, Dは独⽴ ○ p(Y, D) = p(Y)p(D) ● Y, DはZで条件づけると従属する ○ p(Y, D|Z) = p(Z|Y, D)p(Y)p(D)/p(Z) Z Y D

Slide 24

Slide 24 text

23 有向⾮巡回グラフ(Directed Acyclic Graph): どの共変量を選択すべき? ● むやみに共変量を選択してはいけないことがわかる ○ 交絡要因: 分岐 ■ 条件づけない →  交絡バイアスcoufounding ○ 処置後変数 ■ 処置後変数(連鎖経路、合流経路)を条件づける → post-treatment bias ● 複雑なDAGにどう対処する? ○ →バックドアパス

Slide 25

Slide 25 text

24 有効⾮巡回グラフ(Directed Acyclic Graph): バックドアパス ● ブロックされるパス ○ パスpをブロックする集合S ● pがSに含まれる⾮合流点を含む ● pがそれ⾃体もその⼦孫も含まれない合流点を含む ● バックドアパス(back-door paths) ● バックドア基準 ○ SはXの⼦孫を含まない ○ SはXからYへのすべてのバックドアパスをブロックする →集合Sはバックドア基準を満たす ● バックドア基準と conditional ignorability(≒Uncorfounded) は等価 W3 Y D W2 W2 Z3 Z2 Z1

Slide 26

Slide 26 text

25 有効⾮巡回グラフ(Directed Acyclic Graph): バックドアパス ● {Z1, Z3} W3 Y D W1 W2 Z3 Z2 Z1

Slide 27

Slide 27 text

26 観察研究での因果効果推定: 例 マッチング ● The Political Price of Authoritarian Control: Evidence from Francoist Land Settlements in Spain ● RQ ○ 権威主義体制下における強権的政策の代償は? ○ スペインフランコ政権科の強制移住政策が⺠主化後の政党⽀持に影響を与えたか? ● データ ○ Outcome ■ 左派政党‧フランコ後継政党への投票 ○ Treatment ■ 強制移住政策の経験 ● 分析⼿法 ○ マッチング Albertus, Michael, The Political Price of Authoritarian Control: Evidence from Francoist Land Settlements in Spain (February 4, 2022). Available at SSRN: https://ssrn.com/abstract=3948952 or http://dx.doi.org/10.2139/ssrn.3948952

Slide 28

Slide 28 text

27 観察研究での因果効果推定: 例 マッチング ● Treatmentの詳細 ○ Land Settlementがされたか否か ○ ⼤多数が政府が独⾃に指定した灌漑ゾーン内に ■ 処理割り当てメカニズム! ● マッチング ○ 政府がLand Settlementしなかった反事実を形成 ■ 政府が独⾃に指定した灌漑ゾーンおよびフィンカゾーン内に該当するが、新し い町が建設されていない⾃治体から 地理、農業適性、⼈⼝統計、国家能⼒に関 連する共変量に基づいた傾向スコアのロジット推定を使⽤して、⾮置換の neighbor matchingを実⾏. ■ 州,灌漑ゾーンはexact matching Albertus, Michael, The Political Price of Authoritarian Control: Evidence from Francoist Land Settlements in Spain (February 4, 2022). Available at SSRN: https://ssrn.com/abstract=3948952 or http://dx.doi.org/10.2139/ssrn.3948952

Slide 29

Slide 29 text

28 観察研究での因果効果推定: 例 マッチング ● treatmentとcontrol

Slide 30

Slide 30 text

29 観察研究での因果効果推定: 例 マッチング ● 共変量バランス☑

Slide 31

Slide 31 text

30 観察研究での因果効果推定: 例 マッチング ● 結果 ○ 左派政党の得票率は⾼く、後継政党の得票率は低い ○

Slide 32

Slide 32 text

31 観察研究での因果効果推定: ⼿法まとめ ● weighting, mathing ○ 正しいDAGを仮定することができる場合 ● 操作変数法(instrumental variables) ○ 処置割り当てに影響を与えるランダム化されている + 直接結果に影響を与えることのない変数 ● Difference in difference(DiD) ○ over-time variation + parallel trend assumption ● Regression discontinuity (RD) ○ arbitrary thresholds for treatment assignment (continuity assumption) ● Synthetic control method ○ over-time variation + no large idiosyncratic shocks + no anticipation + sufficient pre-intervention information + sufficient post-intervention information

Slide 33

Slide 33 text

32 Thank you