Slide 1

Slide 1 text

Chapter 13: STANDARDIZATION AND THE PARAMETRIC G-FORMULA 1 Junya Miyamoto (@jmiya15) August 22, 2020

Slide 2

Slide 2 text

アジェンダ 2 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 3

Slide 3 text

本⽇お伝えしたいこと 全体的にお伝えしたいポイント ・Standardizationの⽬的は変数Lで調整してMarginal effectを推定すること!(13.1) ・Standardized meanは変数Lの数が多かったり連続値であったりすると⼤変! (13.2, 13.3) →モデリングを⾏って推定し計算を楽にする ・StandardizationとIP Weightingの結果はモデルを使⽤する場合、⼀般的に異なる(13.4) →解析の際はStandardizationとIP Weightingどちらもやってみたほうがいい →可能であればDoubly robust estimationもやってみたほうがいい ・モデルによって推定する場合のデメリットはその妥当性を⽰すのが困難であること(13.5)

Slide 4

Slide 4 text

アジェンダ • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2 4

Slide 5

Slide 5 text

13.1 Standardization as an alternative to IP weighting 13.1で理解すべきポイント ・Standardizationの⽬的は変数Lで調整してMarginal effectを推定すること! ※⽬的はIP weightingと同じ ・Standardized meanは以下の式で計算することができる ・Lがcontinuousの場合以下の式で計算することができる = - = , = 0, = ] × Pr = : = ; = , = 0, = ] × =

Slide 6

Slide 6 text

13.1 Standardization as an alternative to IP weighting Chapter 12にてIP weightingを⽤いて、禁煙が体重増加におよぼすaverage causal effectを推定した。 ※以下の変数Lで調整し、conditional exchangeabilityを仮定した。 >?@,A?B − [>?B,A?B] ※a: treatment c: cencering Average causal effectの定義: Sex Age Race Education intensity and duration of smoking physical activity in daily life recreational exercise weight 6

Slide 7

Slide 7 text

13.1 Standardization as an alternative to IP weighting Chapter 13ではStandardizationを⽤いて、禁煙が体重増加におよぼすaverage causal effectを推定する。 データ仕様書(n=1566)※打ち切りがなかった例数 項⽬ 型 詳細 Weight gain Number Smoking cessation Category 0: untreated、1: treated Age Integer Sex Category 0: male、1: female Race Category 0: white、1: other Education Category 5 categories Weight Number kg Intensity of smoking Number number of cigarettes per day duration of smoking Number years of smoking Physical activity in daily life Category 3 categories Recreational exercise Category 3 categories Baseline Characteristic 7

Slide 8

Slide 8 text

13.1 Standardization as an alternative to IP weighting Standardizationの⽬的 変数Lで調整してMarginal effectを推定すること! ※変数Lで調整した場合にexchangeabilityとpositivityが成⽴していることを条件とする 全体の集団 男性のsubset ⼥性のsubset 禁煙する 禁煙しない 禁煙する 禁煙しない 40% 60% E = 1 = 1, = 0, = 0] = E >?@,A?B = 1 = 0 = 1 4 E = 1 = 0, = 0, = 0] = E >?B,A?B = 1 = 0 = 1 4 E = 1 = 1, = 0, = 1] = E >?@,A?B = 1 = 1 = 2 3 E = 1 = 0, = 0, = 1] = E >?B,A?B = 1 = 1 = 2 3 E[>?@,A?B] = E >?@,A?B = 1 = 0 ∗ Pr = 0 + E >?@,A?B = 1 = 1 ∗ Pr = 1 = 1 4 ∗ 0.4 + 2 3 ∗ 0.6 = 0.5 E[>?B,A?B] = E >?B,A?B = 1 = 0 ∗ Pr = 0 + E >?B,A?B = 1 = 1 ∗ Pr = 1 = 1 4 ∗ 0.4 + 2 3 ∗ 0.6 = 0.5 O[PQRS,TRU] O[PQRU,TRU] = 1 ※禁煙することは体重増加に影響がない 8

Slide 9

Slide 9 text

13.1 Standardization as an alternative to IP weighting Standardizationの⽬的 変数Lで調整してMarginal effectを推定すること! ※変数Lで調整した場合にexchangeabilityとpositivityが成⽴していることを条件とする 全体の集団 男性のsubset ⼥性のsubset 禁煙する 禁煙しない 禁煙する 禁煙しない 40% 60% E = 1 = 1, = 0, = 0] = E >?@,A?B = 1 = 0 = 1 4 E = 1 = 0, = 0, = 0] = E >?B,A?B = 1 = 0 = 1 4 E = 1 = 1, = 0, = 1] = E >?@,A?B = 1 = 1 = 2 3 E = 1 = 0, = 0, = 1] = E >?B,A?B = 1 = 1 = 2 3 E[>?@,A?B] = E >?@,A?B = 1 = 0 ∗ Pr = 0 + E >?@,A?B = 1 = 1 ∗ Pr = 1 = 1 4 ∗ 0.4 + 2 3 ∗ 0.6 = 0.5 E[>?B,A?B] = E >?B,A?B = 1 = 0 ∗ Pr = 0 + E >?B,A?B = 1 = 1 ∗ Pr = 1 = 1 4 ∗ 0.4 + 2 3 ∗ 0.6 = 0.5 O[PQRS,TRU] O[PQRU,TRU] = 1 ※禁煙することは体重増加に影響がない 9 Standardized mean

Slide 10

Slide 10 text

13.1 Standardization as an alternative to IP weighting Lの変数を2つに増やしてみる 全体の集団 男性のsubset ⼥性のsubset 禁煙する 禁煙しない 禁煙する 10% Otherのsubset Whiteのsubset Otherのsubset Whiteのsubset 禁煙しない 禁煙する 禁煙しない 禁煙する 禁煙しない 30% 40% 20% L=0 L=0 L=1 L=1 L=2 L=2 L=3 L=3 E[>?@,A?B] = - = , = 0, = ] × Pr = = : 10

Slide 11

Slide 11 text

13.1 Standardization as an alternative to IP weighting Lがcontinuousだったら・・・? E[>?@,A?B] = - = , = 0, = ] × Pr = = : E[>?@,A?B] = ; = , = 0, = ] × = Probability density function(PDF) 11

Slide 12

Slide 12 text

アジェンダ 12 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 13

Slide 13 text

13.2 Estimating the mean outcome via modeling 13.2で理解すべきポイント ・Confounder Lの数が多かったり変数に複数のレベルがある場合、層の数が多くなって計算が⼤変! ・モデリングによってConditional meanを推定することが可能! →計算が楽に! ・ここで推定したConditional meanを使ったStandardized meanを推定する⽅法は13.3で・・・

Slide 14

Slide 14 text

13.2 Estimating the mean outcome via modeling 理想的には以下のようにnonparametricallyにConditional meanを推定したいが・・・ 全体の集団 男性のsubset ⼥性のsubset 禁煙する 禁煙しない 禁煙する 禁煙しない 40% 60% E = 1 = 1, = 0, = 0] = E >?@,A?B = 1 = 0 = 1 4 E = 1 = 0, = 0, = 0] = E >?B,A?B = 1 = 0 = 1 4 E = 1 = 1, = 0, = 1] = E >?@,A?B = 1 = 1 = 2 3 E = 1 = 0, = 0, = 1] = E >?B,A?B = 1 = 1 = 2 3 Conditional mean ・Confounder Lの数が多い ・変数に複数のレベルがある 数百万層あるのに対象者が数百⼈しかいない なんてことも・・・ 14

Slide 15

Slide 15 text

13.2 Estimating the mean outcome via modeling モデリングによってConditional meanを推定する。 モデル: ℎ = + @ ∗ + _ ∗ + ` ∗ _ + ⋯ +b ∗ ∗ ⽬的変数:weight gain、 説明変数:治療Aおよび9つの交絡因⼦L(2次項、交互作⽤項含む) age E[Y |A = 1, C = 0, L = l] 上記モデルによって、各共変量とmean outcomeの 間のconditional relationを放物曲線で表すことが可能(右図) conditional relation between age and the mean outcome ※この時、mean outcomeに対するageの寄与は 他の共変量の寄与から独⽴している ^ 15

Slide 16

Slide 16 text

13.2 Estimating the mean outcome via modeling モデルおよび今回のデータをもとに、AとLの値の組み合わせごとにConditional meanの推定値を得た。 ※すなわちtreatedの403⼈とuntreatedの1163⼈のConditional meanの推定値を得た 例: non-quitter , male , white , age 26 , college dropout , 15 cigarettes/day , 12 years of smoking habit , moderate exercise , very active , weight 112 kg ただし、本当に知りたいのはStandardized mean・・・ = 1, = 0, = ] = 0.34 ^ E[>?@,A?B] = - = , = 0, = ] × Pr = : E[>?@,A?B] = ; = , = 0, = ] × = Standardized mean 16

Slide 17

Slide 17 text

アジェンダ 17 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 18

Slide 18 text

13.3 Standardizing the mean outcome to the confounder distribution 13.3で理解すべきポイント ・13.2で推定したConditional meanの加重平均でStandardized meanを推定することが可能 ・具体的には以下の4つのステップで推定を⾏う ①データセットの拡張 ②モデリング ③予測 ④平均によるStandardization Standardized mean = E[>?@,A?B] = - = , = 0, = ] × Pr = :

Slide 19

Slide 19 text

13.3 Standardizing the mean outcome to the confounder distribution Standardized meanはConditiondal meanの加重平均である Standardized mean = E[>?@,A?B] = - = , = 0, = ] × Pr = : ※Lが離散の場合、Pr = はそのサブセットの対象者が占める割合となる(P.7の通り) ※Lが多くなれば多くなるほどnonparametricに算出することがとても⾯倒に・・・ 実はこれは問題とする必要がない! 19 - = , = 0, = ] × Pr = = [ = , = 0, ]] = 1 - = , = 0, b ] m b?@ : これだけ推定できればいい! ※nは研究対象者の数

Slide 20

Slide 20 text

13.3 Standardizing the mean outcome to the confounder distribution 実際に以下4つのStepでTable 2.2に適⽤してみる ①データセットの拡張 ②モデリング ③予測 ④平均によるStandardization 20

Slide 21

Slide 21 text

13.3 Standardizing the mean outcome to the confounder distribution 使⽤するコード:What Ifで提供されているRのサンプルコード 使⽤するデータ:What Ifで提供されているNHEFSのデータ ⓪サンプルデータの作成 21

Slide 22

Slide 22 text

13.3 Standardizing the mean outcome to the confounder distribution ①データセットの拡張 22 A=0、YをNullにする A=1、YをNullにする Copy ※Second blockはA=0の時の、Third blockはA=1の時のStandardized meanを推定するために⽤いる

Slide 23

Slide 23 text

13.3 Standardizing the mean outcome to the confounder distribution ①データセットの拡張 23

Slide 24

Slide 24 text

13.3 Standardizing the mean outcome to the confounder distribution ②モデリング AとLを与えた時のmean outcomeの値を予測するための回帰モデルを先の3つのデータセットに当てはめる モデル: 24 Y = + @ ∗ ∗ 積項を⼊れて飽和させる ※3つのデータセットに当てはめても実際のパラメータ推定に使えるのはオリジナルのデータセットのみ (Second, Third blockはYが⽋損しているため) ※αと各βの値を推定することでYを予測するモデル式が得られる 今回はRを⽤いて右のようにパラメータを推定した

Slide 25

Slide 25 text

13.3 Standardizing the mean outcome to the confounder distribution 25 ③予測 ②で推定したパラメータをもとに、Second, Third blockのYを予測する Second block Third block

Slide 26

Slide 26 text

13.3 Standardizing the mean outcome to the confounder distribution 26 ④平均によるStandardization ③で得たSecond, Third blockのYを予測値の平均値を計算し、Standardized meanを得る ※今回、L=1が60%、L=0が40%であるため、L=1の⾏に多くの重みが与えられる 今回計算した結果、いずれも0.5となり、Chapter 2.3の結果と⼀致している!

Slide 27

Slide 27 text

13.3 Standardizing the mean outcome to the confounder distribution NHEFSのデータのように⾼次元のLがある場合にもこの⼿法は使える! 使⽤するデータ:What Ifで提供されているNHEFSのデータ ⓪データの読み込み 27

Slide 28

Slide 28 text

13.3 Standardizing the mean outcome to the confounder distribution ①データセットの拡張 28

Slide 29

Slide 29 text

13.3 Standardizing the mean outcome to the confounder distribution 29 ②モデリング ℎ = + @ ∗ + _ ∗ + ` ∗ _ + ⋯ +b ∗ ∗ モデル

Slide 30

Slide 30 text

13.3 Standardizing the mean outcome to the confounder distribution 30 ③予測 ②で推定したパラメータをもとに、Second, Third blockのYを予測する

Slide 31

Slide 31 text

13.3 Standardizing the mean outcome to the confounder distribution 31 ④平均によるStandardization ③で得たSecond, Third blockのYを予測値の平均値を計算し、Standardized meanを得る 今回の平均因果効果は5.18-1.66=3.52kg(95%CI: 2.6 - 4.5)となった ※平均因果効果の95%信頼区間はbootstrappingを⾏い、算出した(詳しくはTechnical point 13.1を参照) 素朴な疑問。。。(どなたか詳しい⽅にご教⽰いただきたいです・・・) 過学習している場合(または学習⾜りていないときも) = , = 0,b ]の予測値の信頼性が低い気がす るが対策って必要無い?

Slide 32

Slide 32 text

アジェンダ 32 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 33

Slide 33 text

13.4 IP weighting or standardization? 13.4で理解すべきポイント ・StandardizationとIP Weightingの結果はモデルを使⽤する場合、⼀般的に異なる ・解析の際はStandardizationとIP Weightingどちらもやってみたほうがいい ・可能であればDoubly robust estimationもやってみたほうがいい

Slide 34

Slide 34 text

13.4 IP weighting or standardization? 34 Chapter2でやったようにStandardized meanとIP weightingは等しい! ※ただし、このように等しくなるのはそれらを推定する際にモデルが⽤いられていない時だけ! モデルで推定する場合、以下のように利⽤するモデルが異なるため、最終アウトプットは⼀般的に異なる! ■IP weightingの場合: Pr[A = a, C = 0 | L]をPr[A = a | L]およびPr[C = 0 | A = a, L]から推定 ※Pr[A = a | L]およびPr[C = 0 | A = a, L]はlogistic regression modelを当てはめて推定(Chapter 12) ■Standardizationの場合: E[Y | A = a, C = 0, L = l]をparemetric linear regression modelを当てはめて推定(Chapter 13)

Slide 35

Slide 35 text

13.4 IP weighting or standardization? 35 Q. 結局IP weightingとStandardizationはどちらで計算したらいいの?? A. どちらでも計算してみましょう!! どちらでやるにしてもモデルのmisspecificationを避けることは難しい・・・。 かつ、misspecificationが起きているかもわからない・・・。 →⼆つのアプローチで評価することで、もし結果が⼤きく異なれば少なくとも⽚⽅は 深刻なmisspecificationを起こしていると評価可能!! ※もちろん結果が⼀致している場合にどちらのモデルもmisspecificationを起こしている可能性はある ※Fine point 13.2のdoubly robust estimationを⽤いると、いずれか⽚⽅で正しくモデルを設定できていれば 正しい因果効果を推定することが可能

Slide 36

Slide 36 text

13.4 IP weighting or standardization? 36 Standardizationはplug-in g-formulaと⾔われる 理由:g-formulaのconditional mean outcomeを その推定値で置き換えているため ※本章のように推定値がparametric modelから得られる場合 parametric g-formulaと呼ばれる g-formula 簡単に以下のようなDAGを考える E[YX ] = Σc E[YX , C] #Law of total probability = Σc E[YX | C]Pr[C] #Chain rule = Σc E[YX | X, C]Pr[C] #conditional independence(※) = Σc E[Y | X, C]Pr[C] #consistency ※Cで全てのバックドアパスを閉じられると仮定している ため、conditional independenceが成⽴ Y X C ■Parametric g-formula ・AとLで層別化した時のoutcomeの分布の関数(確率密度 関数など)から得られた推定値を利⽤してstandardized valueを計算する⼿法 ・時間依存性共変量が存在しない場合は、Lの分布の parametric modelingを必要としない(?)

Slide 37

Slide 37 text

13.4 IP weighting or standardization? 結論: IP weightingとStandardizationはどちらかではなく、可能であればどちらもやったほうがいい! ※また、さらに可能であればDouble robust methodも使⽤する(Fine point 13.2 or Technical point 13.2) 最後に・・・ 今回は全体のaverage causal effectを推定したけど、特定のサブセットに限定したaverage causal effectも 計算可能である。 その際は計算対象のサブセットを限定するだけで、その他は全て同じやり⽅で実施可能である!

Slide 38

Slide 38 text

アジェンダ 38 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 39

Slide 39 text

13.5 How seriously do we take our estimates? 13.5で理解すべきポイント ・モデルを⽤いて推定した場合、その結果の妥当性を⽰すことは難しい。 ・少なくとも以下の3点が成⽴することを⽰すことが重要。 ①exchangeability, positivity, and consistency ②変数が正しく測定されていること ③モデルが正しいこと

Slide 40

Slide 40 text

13.5 How seriously do we take our estimates? 40 推定値の妥当性を⽰すのはとても⼤変!! 以下の3つの条件が少なくとも近似的に成⽴することを⽰すことが⼤切! ①exchangeability, positivity, and consistency ②変数が正しく測定されていること ③モデルが正しいこと

Slide 41

Slide 41 text

13.5 How seriously do we take our estimates? 41 ①exchangeability, positivity, and consistency ■exchangeabilityについて 今回の例で⾔えば、9つの測定された共変量Lの下、Conditional Exchangeabilityが成⽴している必要あり! ※ E[Ya | A = 1] = E[Ya | A = 0] Sex=M Age=25 ・・・ +3kg 条件A Sex=F Age=32 ・・・ +2.3kg 条件B 条件Aの⼈が仮に条件Bを与えられた場合にoutcomeの値が実際の条件Bの⼈と同じく+2.3kgとなるイメージ!

Slide 42

Slide 42 text

13.5 How seriously do we take our estimates? 42 測定されていない交絡 ①exchangeability, positivity, and consistency Exchangeabilityを妨げる要因 Selection bias これらがあると、E[Ya | A = 1] = E[Ya | A = 0]が成⽴しない!

Slide 43

Slide 43 text

13.5 How seriously do we take our estimates? 43 ①exchangeability, positivity, and consistency ■positivityについて A = 1とA = 0の時で共変量Lの分布が完全にオーバーラップしていないといけない! オーバーラップしていない区間 オーバーラップしていない区間 ※Positivityが成⽴していない例のイメージ

Slide 44

Slide 44 text

13.5 How seriously do we take our estimates? 44 ①exchangeability, positivity, and consistency ■consistencyについて 実際に観測される値とcounterfactual outcomeが等しいこと。 ※E[Ya | A = a] = E[Y | A = a] ■注意点 本章で取り扱っているそれぞれの介⼊(禁煙するorしない)には複数の⽅法があることが⾒込まれる。 ランダム化によって偏りなく割り付けている想定(この想定が崩れるとconsistencyが成⽴しない) 介⼊グループ 想定される介⼊⽅法 禁煙するグループ 段階的に喫煙を減らす ある⽇から突然喫煙をやめる 禁煙しないグループ 喫煙を増やす 喫煙を減らすが0にはしない

Slide 45

Slide 45 text

13.5 How seriously do we take our estimates? 45 ②変数が正しく測定されていること A、Y、または交絡因⼦Lの系統的な測定誤差は⼀般的にbiasをもたらす! ※なのでどのように測定したのかのmethodの記載が重要と考える ③モデルが正しいこと たとえば本章では以下のように2次式でモデル指定していたが、本当は3次、4次の関連がある場合、 交絡を完全に調整しない。 ※Lに全ての交絡因⼦が指定され誤りなく計測されていたとしてもモデル式が誤っていたらbiasをもたらす ℎ = + @ ∗ + _ ∗ + ` ∗ _ + ⋯ +b ∗ ∗ ⽬的変数:weight gain、 説明変数:治療Aおよび9つの交絡因⼦L(2次項、交互作⽤項含む)

Slide 46

Slide 46 text

13.5 How seriously do we take our estimates? 46 これらの条件が成⽴していることを⽰すことができればデータ分析は簡単!!!! →簡単に⽰すことができないから難しい・・・。批判されても反論が難しい・・・ ※たとえば、モデルの仕様については感度解析などで妥当性を⽰すことはできるけど、測定されていない 交絡を⾔い出すとキリがない・・・ 因果推論のタスクは先述の条件がほぼ満たされているという仮定に基づき counterfactual outcomeの⽋如を補っている =これらの条件から逸脱すればするほど推定される効果はbiasを含む!! =これらの条件が成⽴しているか懐疑的になって議論する必要がある!!

Slide 47

Slide 47 text

アジェンダ 47 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 48

Slide 48 text

Fine Point 13.1 48 PositivityはIP weightingと同様にStandardizationでも必要である。 ※Pr[A = a | L = l] = 0 and Pr[L = l] = 0の場合E[Y | A = a, L = l]がundefinedとなるため ただし、StandardizationとIP weightingではPositivity違反の影響が異なる 理由:parametric modelで外挿すればpositivityの違反を無視できるため ※ただし、推定にbiasを持ち込むので95%信頼区間で真の効果を推定することを⾏う age E[Y |A = 1, C = 0, L = l] conditional relation between age and the mean outcome ^ 48 外挿 注意点: ①外装はあくまでデータが無限にあっても推定できない 区間の推定を⽬的に⾏う ※データ量不⾜を補うものではない =「外挿できるからデータ量は少なくても良い」は成⽴しない ②このことがIP weightingよりStandardizationを推奨 することにならない =標準誤差が⼩さくなるがbiasを含む。Biasが標準誤差 よりも多くの推定の誤りを⽣むことも・・・

Slide 49

Slide 49 text

アジェンダ 49 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 50

Slide 50 text

Technical Point 13.1 50 前提: 効果の推定値は標準誤差や95%信頼区間などのランダム性の変動を考慮して表現される 正確な推定値を得ることは難しいので、⼤規模サンプルの場合簡単に計算可能な分布への近似によって 計算されることが多い。 50 複雑すぎて⼤規模サンプルでも簡単に計算可能な分布への近似が困難である場合がある。 →Bootstrappingを⾏い標準誤差および95%信頼区間を推定する!!

Slide 51

Slide 51 text

Technical Point 13.1 51 51 Bootstrappingの考え⽅ 研究対象 (1629⼈) Bootstrap sample1 (1629⼈) Bootstrap sample2 (1629⼈) Bootstrap sample1000 (1629⼈) ・ ・ ・ ATE1 ATE2 ATE1000 ・得られたデータから得られたデータの同数だけランダムに復元抽出する(※データの重複を許容) ・それぞれのBootstrap sampleの興味のあるATEを算出 ・ATEの標準偏差=標準誤差、標準誤差を±1.96倍すると95%信頼区間の推定になる(正規近似) 51

Slide 52

Slide 52 text

Technical Point 13.1 52 52 注意点: ・⼤規模なデータセットで推定を⾏う場合、計算量が多くなる可能性がある →200〜500程度のbootstrap sampleで推定された推定値を参照することはよくある ・Bootstrappingはある程度⼤規模なデータセットでないと⾏えない

Slide 53

Slide 53 text

Technical Point 13.1 53 サンプルコードで95%信頼区間を算出する(※コードの説明は別途⾏う) 結果がテキストと異なるのは確率的にサンプルを作成しているためと思われる

Slide 54

Slide 54 text

アジェンダ 54 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 55

Slide 55 text

Fine Point 13.2 55 55 本章で挙げられていた問題点 ①モデルのmisspecificationを起こす可能性がある →IPWとStandardizationどっちも⾏って感度解析する ②IPWとStandardizationの結果が異なる場合、どちらが正しいのかわからない(どっちも間違えてるかも) →Doubly robust estimatorで推定してみる

Slide 56

Slide 56 text

Fine Point 13.2 56 56 Doubly robust estimator 共変量L 介⼊A 効果Y Model②:E[Y | A = a, L]をモデル化 Model①:Pr[A = a | L = l]をモデル化 Model①、Model②のいずれかが正しい場合、正しい因果効果を得ることが可能

Slide 57

Slide 57 text

Fine Point 13.2 57 57 計算⽅法 1. Model①を作成する Chapter 12のようにIP weightであるp = 1/ )を計算する 2. Model②を作成する 本Chapterで説明したように⼀般化線形モデルでE[Y | A = a, L = l, R]をモデル化する。 ※ R = t p( = 1) −p ( = 0) 3. Model②の予測値を利⽤してA=1およびA=0でのStandardized meanを取得する

Slide 58

Slide 58 text

Fine Point 13.2 58 58 Doubly robust estimationについてまとめ ・IP WeightingとStandardizationのどちらかのモデルが正しければ、正しい因果効果を得られる =どちらのモデルでもmisspecificationしている場合、正しい因果効果を得られない!! ・IP WeightingとStandardizationのどちらが正しいモデルなのかを意識する必要がない! 個⼈的な疑問(時間があったらシミュレーションする→すみません時間とれませんでした) 前提:IP WeightingとStandardizationのいずれかのモデルが正しい=Doubly robust estimationの結果と どちらか(もしくはどちらも)⼀致する ・IP WeightingとStandardizationのどちらのモデルも誤っていた場合、Doubly robust estimationは IP WeightingまたはStandardizationの結果と⼀致する? ・⼀致しない場合、どちらのモデルも誤っていたという結論を出せるので、IP Weightingおよび Standardizationの結果と⽐較してみたほうが良いと考える

Slide 59

Slide 59 text

アジェンダ 59 • 13.1 Standardization as an alternative to IP weighting • 13.2 Estimating the mean outcome via modeling • 13.3 Standardizing the mean outcome to the confounder distribution • 13.4 IP weighting or standardization? • 13.5 How seriously do we take our estimates? • Fine Point 13.1 • Technical Point 13.1 • Fine Point 13.2 • Technical Point 13.2

Slide 60

Slide 60 text

Technical Point 13.2 60 60 前提:positivityとexchangeabilityを満たすA、Y、Lがあるとする。 その時のE[Ya = 1]におけるcounterfactual mean outcomeを推定する E[Ya = 1]はE[b(L)]と書くことができる。この時b(L)は以下のいずれかで表現される b(L) = E[Y | A=1 , L] or E pP v = ※ここで = Pr A = 1 L] 本Chapterではplug-in g-formula estimatorである@ m ∑ | b m b?@ について の推定値を研究対象者の数nで 平均を取った値で置き換えられることを説明した ※ は linear regression modelによって推定する ※IP weightingの場合は@ m ∑ p•P• v ‚ =• について、 m b?@ ( で推定)の推定値を 研究対象者の数nで平均を取った値で置き換えられることを説明した

Slide 61

Slide 61 text

Technical Point 13.2 61 61 推定値( | または ƒ )と実際の値(()または )が離れれば離れるほどbiasが⼤きくなる!! →E[Ya = 1]を推定する際のDoubly robust estimatorは | と ƒ をいい感じに組み合わせる!! =outcome regressionをtreatment modelで補正する(Horvitz-Thompson推定量による補正とも取れる) E[Ya = 1]のDoubly robust estimatorは以下のように表すことができる |[>?@]„… = 1 - | b + b ƒ b b − | b = m b?@ 1 - b b ƒ b − ( b ƒ b − 1) | b m b?@ また、その時のbiasはlarge sampleの場合以下のように表すことができる [ |[>?@]„… − [>?@]] = [()( 1 − 1 ∗ )( − ∗())] ※∗ と∗()はprobability limits。Modelが正しい場合に∗ = 、∗ = ()

Slide 62

Slide 62 text

Technical Point 13.2 62 62 先ほどのbiasの式を再度⽰す [ |[>?@]„… − [>?@]] = [()( 1 − 1 ∗ )( − ∗())] ※∗ と∗()はprobability limits Modelが正しい場合に∗ = 、∗ = ()となるため、どちらかのモデルが正しければ、biasは0となる (どちらが正しいかを知る必要はない) ※もちろんLが⾼次元であることでこのbiasが⼤きくなる場合、 parametric modelが正しくなることは期待できない・・・ ただし、Doubly robust estimationの場合、biasが誤差の積に依存する特性がある。 この特性により、machine learning estimatorを⽤いて と()を推定することでbiasが⼩さい Doubly robust estimatorを得ることができる。 理由:high-dimentional settingにおいては複雑なアルゴリズムに基づくmachine learningの⽅がより 正確な推定値を返すため(ただし、データ量が多いことが条件)