Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Causal Inference: What If, Chapter2

鈴木徳太
October 11, 2022

Causal Inference: What If, Chapter2

鈴木徳太

October 11, 2022
Tweet

More Decks by 鈴木徳太

Other Decks in Science

Transcript

  1. Chapter2, Randomized experiments Causal Inference: What If 横浜市⽴⼤学データサイエンス学部 鈴⽊ 徳太

    Miguel A. Hernan and James M. Robins
  2. ⽬次 1 • Randomization • Conditional randomization • Standardization •

    Inverse probability weighting
  3. 2 はじめに • 「あなたが空を⾒上げることは他者が空を⾒上げることを引き起こすか」 – この疑問には、以下の因果的な疑問 (causal question) の主要な要素が含まれている Ø

    Action(⾏動)︓空を⾒上げる Ø Outcome(アウトカム)︓他者が空を⾒上げる Ø Population(⺟集団)︓e.g.) 2019年にマドリードに在住する⼈々 • この疑問に答えるために以下のような研究デザインを考案 – 歩⾏者が通るたび以下の様なルールで介⼊の実施を決定 – 数千回実験を繰り返し、それぞれの場合の結果を⽐較 コイントス 真っ直ぐ前を⾒る 空を⾒上げる 裏 表 それぞれ場合での歩⾏者の 反応を⽐較
  4. 3 はじめに • 結果 – 介⼊を⾏った場合 → 歩⾏者の55%が空を⾒上げた – 介⼊を⾏わなかった場合

    → 歩⾏者の1%が空を⾒上げた Ø 介⼊のアウトカムへの因果効果の存在が⽰唆される • 介⼊の実施ルールがランダムではなく決定論的である場合には得られる結果は説得⼒に⽋ける – e.g.) 男性なら介⼊を⾏い、⼥性ならば介⼊を⾏わない – 男性(介⼊群)と⼥性(対照群)が⽐較可能ではない可能性 Ø 結果の違いは性別によるものであり、真には介⼊は因果効果を持たない可能性 Ø e.g.) ⼥性の⽅が空を⾒上げにくい傾向 • 本章では、ランダム化(無作為化)が因果関係を考える上で重要となるかついて説明する
  5. Randomization 4

  6. 5 潜在アウトカムの⽋測の問題 • 前節で扱った20名について右表のようなデータが得られたとする – 潜在アウトカム︓𝑌!"#, 𝑌!"$ – 実際に受けた治療︓A –

    観測されたアウトカム︓Y • 潜在アウトカム𝑌!"#, 𝑌!"$は⼀⽅のみが現実には観測される – 潜在アウトカムを⽤いた因果推論における根源問題 (Holland, 1986) – 観測データから得られる結果は、因果ではなく関連を⽰すもの • ランダム化実験であっても潜在アウトカムの⼀⽅は⽋測 – しかし⽋測がランダムに発⽣したとみなすことができるため、 effect measuresを算出(厳密には⼀致推定量を得ることが)可能 A Y 𝑌!"# 𝑌!"$ レイア 0 0 0 ? クロノス 0 1 1 ? デメテル 0 0 0 ? ハデス 0 0 0 ? ヘスティア 1 0 ? 0 ポセイドン 1 0 ? 0 ヘラ 1 0 ? 0 ゼウス 1 1 ? 1 アルテミス 0 1 1 ? アポロン 0 1 1 ? レートー 0 0 0 ? アレス 1 1 ? 1 アテナ 1 1 ? 1 ヘパイストス 1 1 ? 1 アフロディーテ 1 1 ? 1 サイクロプス 1 1 ? 1 ペルセポネ 1 1 ? 1 ヘルメス 1 0 ? 0 へーベー 1 0 ? 0 ディオニュソス 1 0 ? 0
  7. 6 理想的なランダム化実験 • ⺟集団のサイズがほぼ無限であるとする – コイントスの結果が表 → 治療群(𝐴=1 ) –

    コイントスの結果が裏 → 対照群(𝐴=0 ) • 結果 – 関連リスク差︓Pr 𝑌=1 𝐴=1 − Pr 𝑌=1 𝐴=0 = 0.3 - 0.6 = -0.3 – 関連リスク⽐︓Pr 𝑌=1 𝐴=1 / Pr 𝑌=1 𝐴=0 = 0.3 / 0.6 = 0.5 • ランダム化実験の実施にあたっては下記の項⽬を仮定 – 追跡不能が存在しない – 治療の割り当ては試験期間中完全に遵守される – 治療のバージョンは1つ(i.e., no multiple versions of treatmentが仮定される) – ⼆重盲検が実施(Chapter9参照)
  8. 7 割り当てが逆であった場合 • 誤って被験者の治療割り当てが逆に⾏われたとする(TreatedとUntreatedが逆転) – 研究終了時に初めて誤りを認知 • 結論としては上記の誤りは得られる結果に影響を及ぼさない – ランダムな割り当てにより「どの群が治療を受けるか」と「それぞれの場合での死亡リスク」

    は無関係であるため、同様の結果が得られることが予想される • 治療を受けた集団(図中のグレー部分)における死亡リスク︓Pr 𝑌=1 𝐴=1 = 0.3 • 治療を受けなかった集団(図中の⽩⾊部分)における死亡リスク︓Pr 𝑌=1 𝐴=0 = 0.6 – 結果として計算されるassociation measuresも同じ値となる • 2つの集団(治療群、対照群)は交換可能 (exchangeable) である
  9. 8 交換可能性 交換可能性(Exchangeability) 𝑌3 ⊥ 𝐴 for all 𝑎 •

    A が⼆値である場合には、以下の⼆つを意味する – Pr[𝑌!"$ =1|A = 1] = Pr[𝑌!"$ =1|A = 0] – Pr[𝑌!"# =1|A = 1] = Pr[𝑌!"# =1|A = 0] • すべての部分集団における条件付きリスクが等しいので集団全体でのリスクと⼀致する – Pr[𝑌!"$ =1|A = 1] = Pr[𝑌!"$ =1|A = 0] = Pr[𝑌!"$ =1] – Pr[𝑌!"# =1|A = 1] = Pr[𝑌!"# =1|A = 0] = Pr[𝑌!"# =1] • Pr[𝑌!"$ =1|A = 0], Pr[𝑌!"# =1|A = 1]はデータから計算可能であり、理想的なランダム化実験 では関連は因果を⽰しているものとして考えることが出来る (association is causation)
  10. 9 𝒀𝒂 ⊥ 𝑨と𝒀 ⊥ 𝑨 • 𝑌! ⊥ 𝐴

    ︓潜在アウトカムと実際の治療の独⽴ • 𝑌 ⊥ 𝐴 ︓観察されたアウトカムと実際の治療の独⽴ • 20名の例において交換可能性は成り⽴つか︖ – 右図の様な完全なデータが得られたとする – 𝑎 = 0の場合(𝑎 = 1の場合も同様の結果) • Pr[𝑌!"# =1|A = 1] = 3/7 • Pr[𝑌!"# =1|A = 0] = 7/13 – 交換可能性は成り⽴たない • 上記の結果から、ランダム化実験でないと結論付けることは出来ない 1. サンプルサイズの問題(Chapter10参照) 2. 複数回のランダム化を伴う研究デザイン(次節) 𝑌!"# 𝑌!"$ レイア 0 1 クロノス 1 0 デメテル 0 0 ハデス 0 0 ヘスティア 0 0 ポセイドン 1 0 ヘラ 0 0 ゼウス 0 1 アルテミス 1 1 アポロン 1 0 レートー 0 1 アレス 1 1 アテナ 1 1 ヘパイストス 0 1 アフロディーテ 0 1 サイクロプス 0 1 ペルセポネ 1 1 ヘルメス 1 0 へーベー 1 0 ディオニュソス 1 0
  11. 10 Technical Point 2.1 Full exchangeability and mean exchangeability •

    Full exchangeability(完全交換可能性) – ⼆値の治療である場合、(𝑌!"$, 𝑌!"$) ⊥ 𝐴 – より⼀般には、𝓐 = 𝑎, 𝑎%, 𝑎%%, … , 𝑌𝓐 = {𝑌!, 𝑌!" , 𝑌!"" , … }としたとき、𝑌𝒜 ⊥ 𝐴 – ランダム化はfull exchangeabilityを⽰唆する • Mean exchangeability(平均交換可能性) – 治療が⼆値である場合、E[𝑌!| A = 1]=E[𝑌!|A = 0] • ⼆値アウトカムに対してはexchangeabilityとmean exchangeabilityは同じ – アウトカムが連続である場合 • ExchangeabilityはE[𝑌!|A = 𝑎%]=E[𝑌!] (mean exchangeability) を意味するが逆は不成⽴ • 平均以外の分布に関するパラメータ(e.g., 分散)に関しても上記のような等式が成⽴するとは限ら ない ※ 仮定の強さは full exchangeability, exchangeability, mean exchangeabilityの順
  12. Conditional randomization 11

  13. 12 2つのランダム化実験 • 予後因⼦L (1:重症, 0:⾮重症)が各被験者について、治療の割り当て よりも前に得られたとする • 右図のデータは以下の研究デザインのいずれで得られたかを考える –

    デザイン① • ⺟集団から65%の確率でランダムに被験者を選択し治療を実施 – デザイン② • 各被験者をその予後によって分類し、重症者 (L = 1)においては 75%の確率で、⾮重症者 (L = 0) においては50%の確率で治療を実施 • デザイン① – Marginally randomized experiments • デザイン② – Conditionally randomized experiments L A Y レイア 0 0 0 クロノス 0 0 1 デメテル 0 0 0 ハデス 0 0 0 ヘスティア 0 1 0 ポセイドン 0 1 0 ヘラ 0 1 0 ゼウス 0 1 1 アルテミス 1 0 1 アポロン 1 0 1 レートー 1 0 0 アレス 1 1 1 アテナ 1 1 1 ヘパイストス 1 1 1 アフロディーテ 1 1 1 サイクロプス 1 1 1 ペルセポネ 1 1 1 ヘルメス 1 1 0 へーベー 1 1 0 ディオニュソス 1 1 0
  14. 13 期待される交換可能性の違い • 治療群と対照群における交換可能性 Pr[𝑌!"$ =1|A = 1] = Pr[𝑌!"$

    =1|A = 0] or 𝑌! ⊥ 𝐴 for all 𝑎 – Marginally randomized experimentsにおいては期待されるが、conditionally randomized experimentsにおいては期待されない • 20名のデータ – 介⼊群においては69%(13名中9名)が、対照群においては43%(7名中3名)が重症であった (L = 1 ) で あったことから、conditionally randomized experimentsであると結論づける – 交換可能性は成り⽴っておらず、治療と潜在アウトカムは関連している • 条件付き交換可能性 (Conditional exchangeability) 𝑌! ⊥ 𝐴|𝐿 for all 𝑎 – conditionally randomized experimentsで期待される – 無条件での交換可能性を意味しない
  15. 14 条件付き交換可能性の下での因果効果の算出 • Conditionally randomized experimentsにおける因果リスク⽐の算出 – 条件付き交換可能性が成⽴する状況 – 推定に関して(推定対象)は次の2つの選択肢

    1. 集団の特定の層(サブセット)L = 𝑙における平均因果リスク⽐ – Pr[𝑌!"$ =1|L = 𝑙] / Pr[𝑌!"# =1 |L = 𝑙] – 条件付き交換可能性より各層での関連リスク⽐は因果リスク⽐に⼀致 – 特定の層での因果効果を求める⽅法︓層別化 (Stratification) – 各層における因果効果が異なる • 治療効果がLによって修飾されている、Lのレベル間で治療効果の異質性 (heterogeneity) が存在 2. 集団全体における平均因果リスク⽐ – Pr[𝑌!"$ =1] / Pr[𝑌!"# =1] – 次の2つのセクション (Standardization, Inverse probability weighting) を参照
  16. 15 Fine Point 2.1 Crossover experiments(クロスオーバー試験) • ゼウスのライトニングボルトの使⽤はその後の⼀時的な⾎圧の上昇を引き起こすか – 𝐴︓ライトニングボルトの使⽤(0:

    No, 1: Yes) – 𝑌︓介⼊後の⼀時的な⾎圧の上昇(0: No, 1: Yes) – 𝑌!︓潜在アウトカム • ゼウスのクロスオーバー試験 – 昨⽇︓ライトニングボルトを使⽤し (𝑎 = 1)、⾎圧は上昇した (𝑌 = 1) – 今⽇︓ライトニングボルトを使⽤せず (𝑎 = 0)、⾎圧は上昇しなかった (𝑌 = 0) • この試験で得られた結果から個別因果効果がある (𝑌!"# ≠ 𝑌!"$) と判断して良いか︖ – ⼀般には正しくない – 個別因果効果を⽰しているとみなすためには次の3つの強い仮定が全て満たされる必要
  17. 16 Fine Point 2.1 • 𝑡を時間を⽰す変数 (𝑡 = 0, 1)

    とし、治療AとアウトカムYを拡張する – 𝐴() ︓ある個⼈𝑖の時点𝑡における治療変数 – 𝑌 (# !# ︓ある個⼈𝑖の時点𝑡 = 0で𝑎# を受ける場合の、𝑡 = 0における潜在アウトカム – 𝑌 ($ !#, !$ ︓ある個⼈𝑖の時点𝑡 = 0で𝑎# , 𝑡 = 1では𝑎$ を受ける場合の、𝑡 = 1における潜在アウトカム 1. 治療の持ち越し効果がない – 𝑌 ()"$ !#, !$ = 𝑌 ()"$ !$ 2. 個⼈の因果効果は時間に依存しない – 𝑌 () !%"$− 𝑌 () !%"#= 𝛼%, for 𝑡 = 0, 1 3. 未治療の場合の潜在アウトカムは時間に依存しない – 𝑌 () !%"#= 𝛽%, for 𝑡 = 0, 1 • ⼼臓移植のような不可逆的な治療の個別因果効果を考える際にクロスオーバー試験を⽤いること はできない(Fine Point 3.2も参照)
  18. Standardization 17

  19. 18 Standardization • 20名のデータはconditionally randomized experimentsから得られたもの – Pr[Y = 1|

    A = 1, L = 0] = Pr[Y = 1|A = 0, L = 0] = ⁄ $ + – Pr[Y = 1| A = 1, L = 1] = Pr[Y = 1|A = 0, L = 1] = ⁄ , - – L に関して条件付き交換可能性 (𝑌! ⊥ 𝐴|𝐿 for all 𝑎) が成⽴ • e.g.,) Pr[𝑌!"$ =1|L = 0] = Pr[Y = 1|A = 1, L = 0] • 周辺潜在リスクPr[𝑌!=1]は各層での潜在リスクの加重平均と⼀致 – 重みは各層 (𝐿 = 𝑙) の⺟集団に占める割合 – Pr[𝑌!=1] = Pr[𝑌!=1|L = 0] Pr[L = 0]+ Pr[𝑌!=1|L = 1] Pr[L = 1] = ∑. Pr[𝑌!=1|L = 𝑙] Pr[L = 𝑙] – 条件付き交換可能性の下では、 Pr[𝑌!=1] = ∑. Pr[Y = 1|L = 𝑙, 𝐴 = 𝑎] Pr[L = 𝑙] – 上記のように加重平均をとる⽅法はstandardization(標準化)として知られている • 潜在的な量 (e.g., Pr[𝑌!=1]) を観察されたデータの分布 (i.e., 確率) の関数で表現可能なとき、 それはidentifiedである、もしくは、identifiable(識別可能)であるという
  20. Inverse probability weighting 19

  21. 20 Inverse probability weighting • 表としてまとめられていた20名のデータを右図のように考える – 図中では左から右への時間軸 – 円は各時点における集団を表現

    • 右の円は上から順に(L , A)=(0, 0), (0, 1), (1, 0), (1, 1) – 直線は各変数による集団の分岐を意味 • 変数の後ろの数値はその分岐確率 • Lの各層において実際に治療を受けた集団は、そうでなかった集団と同じ死亡リスクをもつとする – 条件付き交換可能性を仮定することと同義 – L=0の8名中4名が実際には治療を受けておらず、そのうち1名が⽣存 • もし8名全員が治療を受けていなかった場合には2名が⽣存すると予想される – L=1の12名中3名が実際には治療を受けておらず、そのうち2名が⽣存 • もし12名全員が治療を受けていなかった場合には2名が⽣存すると予想される – それぞれの層で全員が治療を受けていたどうなっていたかについても同様の議論
  22. 21 Inverse probability weighting • L=0, 1となる確率と各層(サブセット)における潜在的な結果が既知 – 標準化の時と同様にPr[Y!"# =1],

    Pr[Y!"$ =1]を計算 • e.g.,) Pr[Y!"# =1] – Pr[L = 0]=0.4, Pr[L = 1]=0.6 – Pr[Y!=1|L = 0]=2/8 – Pr[Y!=1|L = 1]=8/12 • 上図 – L = 0, 1のそれぞれの部分集団で、もし全員が治療を受けていなかった場合 の結果 – Pr[Y!"# =1]が算出可能 • 下図 – L = 0, 1のそれぞれの部分集団で、もし全員が治療を受けていた場合の結果 – Pr[Y!"# =1]が算出可能
  23. 22 Inverse probability weighting • 前スライド中の、2つの潜在的な結果を統合したものが右図 • 元の集団の2倍のサイズとなる仮想的な集団が⽣成 – 擬似⺟集団

    (pseudo population) • 元の集団において条件付き交換可能性が成⽴するとき 擬似⺟集団においては交換可能性が成⽴ – 擬似⺟集団におけるassociationはcausationであると解釈可能 • 元の集団における個⼈をそれぞれが実際に受けた治療を受ける確率の逆数で重み付け – Inverse probability (IP) weighting – 実際に受けた治療を受ける確率の逆数を重みとする – ある個⼈は擬似⺟集団においては重み分の⼈数として扱われる • e.g.,) L = 0かつUntreatedである個⼈ – 重みは2 (=1/0.5) であるため、擬似⺟集団では2名分の扱い
  24. 23 Inverse probability weighting • IP weightingとstandardization – 集団全体が治療を受けていなかったら、もしくは受けていたらという潜在的な結果を作り出す という点は本質的に同じだが利⽤する確率が異なる

    – Standardization • 共変量L の確率と、共変量L と治療A が与えられた時のアウトカムYの確率 – IP weighting • 共変量L が与えられた時にある治療を受ける確率 • 理想的なランダム化実験のデータに適切な⼿法 (IP weighting, standardization) することで 興味のある因果効果の値を計算することが可能 – 倫理的、費⽤的、時間的制約からランダム化実験を⾏うことが出来ない可能性 – 次章以降では既存のデータを⽤いて因果推論をどう⾏うか、観察研究における因果推論についても 注⽬する
  25. 24 Fine Point 2.2 Risk periods(リスク期間) • リスク (Risk)︓特定の期間に興味のあるアウトカムを発⽣させる被験者の割合 –

    この期間をrisk period(リスク期間)といい、問題はリスク期間をどの程度おくべきか • e.g.,) 抗⽣物質の使⽤が、ペスト菌に感染した⾼齢者の死亡リスクに及ぼす因果効果 – 因果効果の定量化のためにランダム化実験が実施 – 研究者① • 因果リスク⽐の値は0.05であるため、抗⽣物質の使⽤の平均因果効果は存在する – 研究者① • 因果リスク⽐の値は1であるため、抗⽣物質の使⽤の平均因果効果は存在する • どちらの研究者の主張も正しい – リスク期間を研究者①は1年、研究者②は100年と設定(治療に関わらず被験者は全員死亡) – ある治療が死亡リスクに因果効果を持つことは、死亡を防ぐのではなく死亡を遅らせることを意味
  26. 25 Technical Point 2.2 Formal definition of IP weights •

    ある個⼈のIP weightはその個⼈の治療𝐴と共変量𝐿に依存 – e.g.,) 𝐿 = 𝑙であり実際に治療を受けた個⼈の重み︓ 1/Pr[A =1|𝐿 = 𝑙] • 治療𝐴と共変量𝐿の値に関係なく全ての重みを確率密度関数 (PFD) を⽤いて表現することが可能 – 𝑓/|1 𝑎 𝑙 = 𝑓[𝑎|𝑙]︓ 𝐿 = 𝑙が与えられた時の𝐴 = 𝑎の条件付き確率密度関数 • 𝐴, 𝐿が離散値である場合には条件付き確率Pr[𝐴 = 𝑎|𝐿 = 𝑙] – Conditionally randomized experimentsにおいてはPr[𝐿 = 𝑙]≠0である全ての𝑙に対して𝑓 𝑎 𝑙 > 0 • Chapter3, Positivityのセクションを参照 • 各個⼈の重み𝑊& – 𝑊/ = 1/𝑓[𝐴|𝐿]
  27. 26 Technical Point 2.3 Equivalence of IP weighting and standardization

    • 𝐴は無限の実現値をもつ離散変数であり、Pr[𝐿 = 𝑙]≠0である全ての𝑙に対して𝑓 𝑎 𝑙 > 0 (positivity) が成⽴するとする • 正値性の下で治療レベル𝑎におけるstandardized mean, IP weighted meanは以下のように定義 – standardized mean • ∑. E[Y | A = 𝑎, L = 𝑙] Pr[L = 𝑙] – IP weighted mean • E 2 /"! 3 4[/|1] • 指⽰関数 𝐼 𝐴 = 𝑎 ︓ 𝐴 = 𝑎のときのみ1, それ以外では0となる
  28. 27 Technical Point 2.3 • 正値性の下でstandardized meanとIP weighted meanが等しいことの証明 –

    E ' &"! ( )[&|,] = ∑. # )[!|.] {E[Y|𝐴 = 𝑎, L = 𝑙]𝑓[𝑎|𝑙] Pr[L = 𝑙]} = ∑. {E[Y|𝐴 = 𝑎, L = 𝑙] Pr[L = 𝑙]} – 等号1つ⽬︓期待値の定義(と指⽰関数の特性) – 等号2つ⽬︓分⺟と分⼦の𝑓[𝑎|𝑙]をキャンセル • 𝐴は離散変数であるとしたが必ずしも⼆値変数である必要はなく、また連続変数である場合には Σの部分を積分の形で考えればよい
  29. 28 Technical Point 2.3 • 条件付き交換可能性も仮定することでstandardized meanとIP weighted meanがともに 潜在アウトカムの周辺期待値E[𝑌!]に⼀致することの証明

    1. Standardized meanについて – E[𝑌!] = ∑. {E[𝑌!|L = 𝑙] Pr[L = 𝑙]}(∵加重平均) = ∑. {E[𝑌!|𝐴 = 𝑎, L = 𝑙] Pr[L = 𝑙]} (∵条件付き交換可能性) = ∑. {E[Y |𝐴 = 𝑎, L = 𝑙] Pr[L = 𝑙]} (∵⼀致性) 2. IP weighted meanについて – E 2 /"! 3 4[/|1] = E 2 /"! 3& 4[/|1] (∵⼀致性) = E E 2 /"! 4[!|1] 𝑌!|𝐿 (∵正値性) = E E 2 /"! 4[!|1] 𝑌!|𝐿 E[𝑌!|L ] (∵条件付き交換可能性) = E E[𝑌!|L ] (∵ E 2 /"! 4[!|1] 𝑌!|𝐿 =1) = E[𝑌!]