1.6k

# Randomized experiments (Causal inference: What if, Chapter 2)

Keywords: 因果推論, Randomization（ランダム化）, Conditional randomization（条件付きランダム化）, Standardization（標準化）, Inverse probability weighting（逆確率重み付け）

## Shuntaro Sato

November 18, 2020

## Transcript

1. ### Chapter 2 RANDOMIZED EXPERIMENTS komuRa Twitter: @hizakayu 1

• 2.3 Standardization • 2.4 Inverse probability weighting • Fine Points • 2.1 Crossover experiments • 2.2 Risk period • Technical Points • 2.1 Full exchangeability and mean exchangeability • 2.2 Formal definition of IP weights • 2.3 Equivalence of IP weighting and standardization 2

4. ### Randomized experiment 理想的なデータ(Table1.1) Effect measureが計算できる。 現実的なデータ(Table2.1) Association measureしか計算できない。 4 Randomized

experimentsでは、Table2のようなmissing valueを含むデー タしか手に入らないにもかかわらず、effect measureを計算できる。 ∵missing valueがランダムに起きることが保証されている。
5. ### “exchangeable”な2群 A=１ Pr[Y=1|A=1]=0.3 A=０ Pr[Y=1|A=0]=0.6 assoc/ risk ratio = 0.3/0.6

= 0.5 assoc/ risk diff = 0.3 – 0.6 = -0.3 A=１ Pr[Y=1|A=1]=0.3 A=０ Pr[Y=1|A=0]=0.6 assoc/ risk ratio = 0.3/0.6 = 0.5 assoc/ risk diff = 0.3 – 0.6 = -0.3 5 別の群が治療に割り当てられてもassociation measureが同じ。 このような場合に、2群は“exchangeable”という。
6. ### Exchangeabilityの表し方 • Exchangeabilityとは、 Pr Ya = 1 A = 1

= Pr Ya = 1 A = 0 = Pr Ya = 1 , for both a=0 and a=1 • また、Exchangeabilityは , for all values a 6
7. ### Exchangeabilityの意義 • Exchangeabilityの下では、それぞれ、 Pr Y=1 = 1 = Pr Y

= 1 A = 1 , Pr Y=0 = 1 = Pr Y = 1 A = 0 が成り立つ。 • 現実の値から counterfactual risk が計算できる。 • 現実の値から causal risk ratio / diff が計算できる。 • 理想的なランダム化試験では、“Association is causation.” 7
8. ### Couterfactual outcome, Ya について • Yaは、治療が割り付けられる前から決まっているもの。 • Yaは、治療aに割り当てられたときの起こるであろうアウトカ ムのことをエンコードするもの。 •

Yaは、実際に割り当てられる治療とは独立。 • そういう点で、 Yaは遺伝子構成のようなもの。 • Yaと遺伝子構成と違うのは、 Yaが治療が割り当てられた後にし か判明せず、かつ、治療Aがaであったときにしか判明しないこ と。 8
9. ### と の違い • は、治療群と非治療群を入れ替えても同じリスクにな ること。 • が成り立つからといって、 とは限らない。 例えば、 •

ランダム化試験では である。 • しかし、治療に効果がある場合、治療はアウトカムと関連する ため、 とはならない。 9
10. ### Table2.1ではExchangeabilityは成立？ 理想的なデータ(Table1.1) 現実的なデータ(Table2.1) • a = 0について Pr Y=0 =

1| = 1 = 7 13 ≓ 0.54 Pr Y=0 = 1| = 0 = 3 7 ≓ 0.43 • a = 1について Pr Y=0 = 1| = 1 = 7 13 ≓ 0.54 Pr Y=0 = 1| = 0 = 3 7 ≓ 0.43 以上から、 は成立しない。 10
11. ### Exchangeabilityが成立しなければ、 Randomized experimentでないといえる？ 仮に理想的なデータ（Table1.1）があったとしても、二つの理 由から結論付けられない。 • サンプルサイズが小さい。 • Exchangeabilityが成立していなくても、randomized experimentであり得る。

• 二つ以上のコインを使う場合→conditional randomization 11

13. ### Marginal experiments と conditional randomized experiments 予後因子Lを加えたデータ （Table2.2） Design1 [marginally

randomized experiments] • Design2 [conditionally randomized experiments] 13
14. ### Design 1 marginal experiments • Marginally randomized experiment なら、 Pr

Ya = 1 A = 1 = Pr Ya = 1 A = 0 (= Pr Ya = 1 ) or , for all a が成り立つはず。 • しかし、今回は治療群と非治療群とで予後因子Lの分布が違う （69%(=9/13) vs 43%(=3/7)）。 • 治療AがYaを予測しているため、 が成立しない。 14
15. ### Design 2 conditionally randomized experiments① • Critical condition かどうかで分けた後、subset ごとにmarginally

randomized experiments を行っている。 • Critical condition(L=1)である人に限れば、Yaのリスクは同じになるので、 Pr Ya = 1 A = 1, L = 1 = Pr Ya = 1 A = 0, L = 1 or |L=1 が成り立つ。 15
16. ### Design 2 conditionally randomized experiments② • Non critical condition（L=0）の subset

でも同様なので、 |L=l, for all l. が成り立つ。 • シンプルに表すと |L • これをconditional exchangeabilityという。 16
17. ### Conditinally randomized experimentsでの 二つの計算。 Causal effectsの計算にあたって、選択肢が二つある。 • Subset ごとにcausal effect計算（=

Stratification） L=1のとき Pr Ya = 1 A = 1, L = 1 / Pr Ya = 1 A = 0, L = 1 L=0のとき Pr Ya = 1 A = 1, L = 0 / Pr Ya = 1 A = 0, L = 0 • 平均のcaucal effectを計算 • Standardization • Inverse probability weighting 17

19. ### Standardization① ∵ |L • 今知りたいのは、 Pr[Ya=1 = 1] / Pr[Ya=0

= 1] ⋯ ★ 19 Pr Y = 1 A = 1, L = 0 = 1 4 = Pr[Y=1 = 1|L = 0] Pr Y = 1 A = 0, L = 0 = 1 4 = Pr[Y=0 = 1|L = 0] Pr Y = 1 A = 1, L = 1 = 2 3 = Pr[Y=1 = 1|L = 1] Pr Y = 1 A = 0, L = 1 = 2 3 = Pr[Y=0 = 1|L = 1]
20. ### Standardization② ★の分子= Pr[Ya=1 = 1] = 全員が治療された（A=1）ときのリスク = subsetのサイズに比例した重みをもつ加重平均 =

Pr Y=1 = 1 L = 0 ∗ 0.4 + Pr Y=1 = 1 L = 1 ∗ 0.6 = 1 4 ∗ 0.4 + 2 3 ∗ 0.6 = 0.5 • 同様にして ★の分母= Pr[Ya=0 = 1] = 0.5 • よって、 Pr[Ya=1 = 1] / Pr[Ya=0 = 1] = 1 20
21. ### Standardization③ • Marginal counterfactural riskというのは、 Pr[Ya = 1] = Pr

= 1 = 0 Pr = 0 + Pr = 1 = 1 Pr = 1 = Pr = 1 = Pr = = Pr = 1 = , = Pr = • 観察データの分布の関数でcounterfactural quarityが表せられ るとき、”identified” または “identifiable”という。 21

23. ### Fully randomized causally interpreted structured tree graph FRCISTG Table2.2 23

これを使って、Pr[Ya=1 = 1] / Pr[Ya=0 = 1] ⋯ ★ を算出する
24. ### 仮に全員がA=0だったとしたもの 分母（Pr[=0 = 1]）の計算 観察したもの 24 ∴Pr Ya=0 = 1

= 2+8 20 = 0.5 ⋯ ☽
25. ### 仮に全員がA=1だったとしたもの 分子（Pr[=1 = 1]）の計算 観察したもの 25 ∴Pr Ya=1 = 1

= 2+8 20 = 0.5 ⋯ ☀
26. ### Pseudo-population Pseudo-population と Inverse probability weighting 26 |L のもとでは、Pseudo-population の

associational risk ratio と もともとの populationの causal risk ratio は等しくなる。
27. ### Standardization と Inverse probability weighting • どちらの過程も、すべての人が治療 a を受けたときのシミュ レーションを行っているとみなせる。

• Inverse probability weightingでは、共変量Lで条件づけたと きの治療Aの条件付確率を使っている。 • Pr = | = • Standardizationでは、共変量Lの確率とAとLで条件づけたとき のYの条件付確率を使っている。 • Pr = と Pr = 1 = , = 27

29. ### Fine Point 2.1 Crossover experiment • ライトニングボルトと血圧 • 同一の個人の異なるtreatment下でのアウトカムを比較するような研究デ ザインを

crossover experiment という。 29 yesterday today
30. ### Fine Point 2.1 Crossover experiment 個人の因果効果を同定するためには3つの仮定が必要。 1) Carryover effect がない。

=1 0 , 1 = =1 1 2) Individual causal effect が時間に寄らない。 =1 − =0 = , for t = 0, 1 3) 治療しない場合の counterfactual outcome が時間に寄らない。 =0 = , for t = 0, 1 30
31. ### Fine Point 2.1 Crossover experiment 1 − 0 = 1

1 =1 − 0 0 =0 ∵consistensy = 1 1 =1 − 1 1 =0 + 1 1 =0 − 0 0 =0 = + − ∵(2), (3) = 31
32. ### Fine Point 2.2 Risk Period • リスク：一定期間内にアウトカムを発生した人の割合。 • 期間が重要。 例えば、

• 同じ研究データに基づいていても、 RR of 1 year = 0.05, RR of 100 year = 1 となることはあり得る。 • 治療が死亡に関して因果的効果を持つというのは、死亡を防ぐことを意味 するのではなくて、死亡を遅らせることを意味する。 32

34. ### Technical Point 2.1 Full exchangeability and mean exchangeability • Full

exchangeability: The set of all treatment values: The set of all counterfactual outcome: • Mean exchangeability: E = = E[] • Exchangeability ならば mean exchangeability は成り立つが、逆 は成り立たない（例えば、分散などの平均以外のパラメータが treatment と独立にならないため）。 34
35. ### Technical Point 2.1 Full exchangeability and mean exchangeability • 因みに、E

= E[| = ]を証明するにはmean exchangeabilityで十分。 右辺 = E[| = ] = E | = ∵consistensy = E ∵mean exchangeability = 左辺 • アウトカムが二値変数の場合、exch/とmean exch/ は同じになる。 35
36. ### Technical Point 2.2 Formal definition of IP weights • IP

weights: = 1 • 確率ではなくて、確率密度関数で定義される。 • 離散変数では、 = Pr[ = | = ] • 各個人に対する重みがそれぞれの個人のA, Lの値で決まるため、ある特定 の値a, lではなくて確率変数A, Lで表す。 • Pr[ = | = ]という表現が不適切なため、確率密度関数で定義する。 36
37. ### Technical Point 2.3 Equivalence of IP weighting and standardization Standardized

mean = Pr = 1 = , = Pr = IP weighted mean = E[ = [|] ] Standardized mean = IP weighted mean の証明。 証明） IP weighted mean = E[ = [|] ] IP weighted mean = 1 [|] {E = , = Pr[ = ]} IP weighted mean = Pr = 1 = , = Pr = IP weighted mean = Standardized mean 37
38. ### Technical Point 2.3 Equivalence of IP weighting and standardization 更にconditional

exchangeabilityを仮定すれば IPW mean と Std/ mean が counterfactual outcome と同じになる。 Standardized meanについて E = Pr = Pr = E = Pr = , = Pr = ∵conditional exchangeability, positivity E = Pr = , = Pr = ∵consistency E = Standardized mean 38
39. ### Technical Point 2.3 Equivalence of IP weighting and standardization IPW

meanについて IP weighted mean = E[ = [|] ] IP weighted mean = E[ = [|] ] ∵consistensy IP weighted mean = E{E = | } ∵条件付期待値の公式 IP weighted mean = E{E = | E[|]} ∵condiditional exchangeability IP weighted mean = E{E | } ∵E = | = 1 IP weighted mean = E IP weighted mean = counterfactual outcome 39
40. ### Reference • Hernán MA, Robins JM (2020). Causal Inference: What

If. Boca Raton: Chapman & Hall/CRC. • 条件付期待値, 分散の意味と有名公式 from https://mathtrain.jp/condexpectation. • Icons made by Freepik, Those Icons and Smashicons from www.flaticon.com. 40