Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Randomized experiments (Causal inference: What if, Chapter 2)

Shuntaro Sato
November 18, 2020

Randomized experiments (Causal inference: What if, Chapter 2)

Keywords: 因果推論, Randomization(ランダム化), Conditional randomization(条件付きランダム化), Standardization(標準化), Inverse probability weighting(逆確率重み付け)

Shuntaro Sato

November 18, 2020
Tweet

More Decks by Shuntaro Sato

Other Decks in Science

Transcript

  1. Table of contents • 2.1 Randomization • 2.2 Conditional randomization

    • 2.3 Standardization • 2.4 Inverse probability weighting • Fine Points • 2.1 Crossover experiments • 2.2 Risk period • Technical Points • 2.1 Full exchangeability and mean exchangeability • 2.2 Formal definition of IP weights • 2.3 Equivalence of IP weighting and standardization 2
  2. Randomized experiment 理想的なデータ(Table1.1) Effect measureが計算できる。 現実的なデータ(Table2.1) Association measureしか計算できない。 4 Randomized

    experimentsでは、Table2のようなmissing valueを含むデー タしか手に入らないにもかかわらず、effect measureを計算できる。 ∵missing valueがランダムに起きることが保証されている。
  3. “exchangeable”な2群 A=1 Pr[Y=1|A=1]=0.3 A=0 Pr[Y=1|A=0]=0.6 assoc/ risk ratio = 0.3/0.6

    = 0.5 assoc/ risk diff = 0.3 – 0.6 = -0.3 A=1 Pr[Y=1|A=1]=0.3 A=0 Pr[Y=1|A=0]=0.6 assoc/ risk ratio = 0.3/0.6 = 0.5 assoc/ risk diff = 0.3 – 0.6 = -0.3 5 別の群が治療に割り当てられてもassociation measureが同じ。 このような場合に、2群は“exchangeable”という。
  4. Exchangeabilityの表し方 • Exchangeabilityとは、 Pr Ya = 1 A = 1

    = Pr Ya = 1 A = 0 = Pr Ya = 1 , for both a=0 and a=1 • また、Exchangeabilityは , for all values a 6
  5. Exchangeabilityの意義 • Exchangeabilityの下では、それぞれ、 Pr Y=1 = 1 = Pr Y

    = 1 A = 1 , Pr Y=0 = 1 = Pr Y = 1 A = 0 が成り立つ。 • 現実の値から counterfactual risk が計算できる。 • 現実の値から causal risk ratio / diff が計算できる。 • 理想的なランダム化試験では、“Association is causation.” 7
  6. Couterfactual outcome, Ya について • Yaは、治療が割り付けられる前から決まっているもの。 • Yaは、治療aに割り当てられたときの起こるであろうアウトカ ムのことをエンコードするもの。 •

    Yaは、実際に割り当てられる治療とは独立。 • そういう点で、 Yaは遺伝子構成のようなもの。 • Yaと遺伝子構成と違うのは、 Yaが治療が割り当てられた後にし か判明せず、かつ、治療Aがaであったときにしか判明しないこ と。 8
  7. と の違い • は、治療群と非治療群を入れ替えても同じリスクにな ること。 • が成り立つからといって、 とは限らない。 例えば、 •

    ランダム化試験では である。 • しかし、治療に効果がある場合、治療はアウトカムと関連する ため、 とはならない。 9
  8. Table2.1ではExchangeabilityは成立? 理想的なデータ(Table1.1) 現実的なデータ(Table2.1) • a = 0について Pr Y=0 =

    1| = 1 = 7 13 ≓ 0.54 Pr Y=0 = 1| = 0 = 3 7 ≓ 0.43 • a = 1について Pr Y=0 = 1| = 1 = 7 13 ≓ 0.54 Pr Y=0 = 1| = 0 = 3 7 ≓ 0.43 以上から、 は成立しない。 10
  9. Design 1 marginal experiments • Marginally randomized experiment なら、 Pr

    Ya = 1 A = 1 = Pr Ya = 1 A = 0 (= Pr Ya = 1 ) or , for all a が成り立つはず。 • しかし、今回は治療群と非治療群とで予後因子Lの分布が違う (69%(=9/13) vs 43%(=3/7))。 • 治療AがYaを予測しているため、 が成立しない。 14
  10. Design 2 conditionally randomized experiments① • Critical condition かどうかで分けた後、subset ごとにmarginally

    randomized experiments を行っている。 • Critical condition(L=1)である人に限れば、Yaのリスクは同じになるので、 Pr Ya = 1 A = 1, L = 1 = Pr Ya = 1 A = 0, L = 1 or |L=1 が成り立つ。 15
  11. Design 2 conditionally randomized experiments② • Non critical condition(L=0)の subset

    でも同様なので、 |L=l, for all l. が成り立つ。 • シンプルに表すと |L • これをconditional exchangeabilityという。 16
  12. Conditinally randomized experimentsでの 二つの計算。 Causal effectsの計算にあたって、選択肢が二つある。 • Subset ごとにcausal effect計算(=

    Stratification) L=1のとき Pr Ya = 1 A = 1, L = 1 / Pr Ya = 1 A = 0, L = 1 L=0のとき Pr Ya = 1 A = 1, L = 0 / Pr Ya = 1 A = 0, L = 0 • 平均のcaucal effectを計算 • Standardization • Inverse probability weighting 17
  13. Standardization① ∵ |L • 今知りたいのは、 Pr[Ya=1 = 1] / Pr[Ya=0

    = 1] ⋯ ★ 19 Pr Y = 1 A = 1, L = 0 = 1 4 = Pr[Y=1 = 1|L = 0] Pr Y = 1 A = 0, L = 0 = 1 4 = Pr[Y=0 = 1|L = 0] Pr Y = 1 A = 1, L = 1 = 2 3 = Pr[Y=1 = 1|L = 1] Pr Y = 1 A = 0, L = 1 = 2 3 = Pr[Y=0 = 1|L = 1]
  14. Standardization② ★の分子= Pr[Ya=1 = 1] = 全員が治療された(A=1)ときのリスク = subsetのサイズに比例した重みをもつ加重平均 =

    Pr Y=1 = 1 L = 0 ∗ 0.4 + Pr Y=1 = 1 L = 1 ∗ 0.6 = 1 4 ∗ 0.4 + 2 3 ∗ 0.6 = 0.5 • 同様にして ★の分母= Pr[Ya=0 = 1] = 0.5 • よって、 Pr[Ya=1 = 1] / Pr[Ya=0 = 1] = 1 20
  15. Standardization③ • Marginal counterfactural riskというのは、 Pr[Ya = 1] = Pr

    = 1 = 0 Pr = 0 + Pr = 1 = 1 Pr = 1 = Pr = 1 = Pr = = Pr = 1 = , = Pr = • 観察データの分布の関数でcounterfactural quarityが表せられ るとき、”identified” または “identifiable”という。 21
  16. Fully randomized causally interpreted structured tree graph FRCISTG Table2.2 23

    これを使って、Pr[Ya=1 = 1] / Pr[Ya=0 = 1] ⋯ ★ を算出する
  17. Pseudo-population Pseudo-population と Inverse probability weighting 26 |L のもとでは、Pseudo-population の

    associational risk ratio と もともとの populationの causal risk ratio は等しくなる。
  18. Standardization と Inverse probability weighting • どちらの過程も、すべての人が治療 a を受けたときのシミュ レーションを行っているとみなせる。

    • Inverse probability weightingでは、共変量Lで条件づけたと きの治療Aの条件付確率を使っている。 • Pr = | = • Standardizationでは、共変量Lの確率とAとLで条件づけたとき のYの条件付確率を使っている。 • Pr = と Pr = 1 = , = 27
  19. Fine Point 2.1 Crossover experiment 個人の因果効果を同定するためには3つの仮定が必要。 1) Carryover effect がない。

    =1 0 , 1 = =1 1 2) Individual causal effect が時間に寄らない。 =1 − =0 = , for t = 0, 1 3) 治療しない場合の counterfactual outcome が時間に寄らない。 =0 = , for t = 0, 1 30
  20. Fine Point 2.1 Crossover experiment 1 − 0 = 1

    1 =1 − 0 0 =0 ∵consistensy = 1 1 =1 − 1 1 =0 + 1 1 =0 − 0 0 =0 = + − ∵(2), (3) = 31
  21. Fine Point 2.2 Risk Period • リスク:一定期間内にアウトカムを発生した人の割合。 • 期間が重要。 例えば、

    • 同じ研究データに基づいていても、 RR of 1 year = 0.05, RR of 100 year = 1 となることはあり得る。 • 治療が死亡に関して因果的効果を持つというのは、死亡を防ぐことを意味 するのではなくて、死亡を遅らせることを意味する。 32
  22. Technical Point 2.1 Full exchangeability and mean exchangeability • Full

    exchangeability: The set of all treatment values: The set of all counterfactual outcome: • Mean exchangeability: E = = E[] • Exchangeability ならば mean exchangeability は成り立つが、逆 は成り立たない(例えば、分散などの平均以外のパラメータが treatment と独立にならないため)。 34
  23. Technical Point 2.1 Full exchangeability and mean exchangeability • 因みに、E

    = E[| = ]を証明するにはmean exchangeabilityで十分。 右辺 = E[| = ] = E | = ∵consistensy = E ∵mean exchangeability = 左辺 • アウトカムが二値変数の場合、exch/とmean exch/ は同じになる。 35
  24. Technical Point 2.2 Formal definition of IP weights • IP

    weights: = 1 • 確率ではなくて、確率密度関数で定義される。 • 離散変数では、 = Pr[ = | = ] • 各個人に対する重みがそれぞれの個人のA, Lの値で決まるため、ある特定 の値a, lではなくて確率変数A, Lで表す。 • Pr[ = | = ]という表現が不適切なため、確率密度関数で定義する。 36
  25. Technical Point 2.3 Equivalence of IP weighting and standardization Standardized

    mean = Pr = 1 = , = Pr = IP weighted mean = E[ = [|] ] Standardized mean = IP weighted mean の証明。 証明) IP weighted mean = E[ = [|] ] IP weighted mean = 1 [|] {E = , = Pr[ = ]} IP weighted mean = Pr = 1 = , = Pr = IP weighted mean = Standardized mean 37
  26. Technical Point 2.3 Equivalence of IP weighting and standardization 更にconditional

    exchangeabilityを仮定すれば IPW mean と Std/ mean が counterfactual outcome と同じになる。 Standardized meanについて E = Pr = Pr = E = Pr = , = Pr = ∵conditional exchangeability, positivity E = Pr = , = Pr = ∵consistency E = Standardized mean 38
  27. Technical Point 2.3 Equivalence of IP weighting and standardization IPW

    meanについて IP weighted mean = E[ = [|] ] IP weighted mean = E[ = [|] ] ∵consistensy IP weighted mean = E{E = | } ∵条件付期待値の公式 IP weighted mean = E{E = | E[|]} ∵condiditional exchangeability IP weighted mean = E{E | } ∵E = | = 1 IP weighted mean = E IP weighted mean = counterfactual outcome 39
  28. Reference • Hernán MA, Robins JM (2020). Causal Inference: What

    If. Boca Raton: Chapman & Hall/CRC. • 条件付期待値, 分散の意味と有名公式 from https://mathtrain.jp/condexpectation. • Icons made by Freepik, Those Icons and Smashicons from www.flaticon.com. 40