$30 off During Our Annual Pro Sale. View Details »

Standardization and the parametric G-formula(Causal inference: What if, Chapter 13)

Shuntaro Sato
November 25, 2020

Standardization and the parametric G-formula(Causal inference: What if, Chapter 13)

Keywords: 因果推論, Standardization(標準化), Parametric G-formula, Bootstrap

Shuntaro Sato

November 25, 2020
Tweet

More Decks by Shuntaro Sato

Other Decks in Science

Transcript

  1. Chapter 13:
    STANDARDIZATION AND THE
    PARAMETRIC G-FORMULA
    1
    Junya Miyamoto (@jmiya15)
    August 22, 2020

    View Slide

  2. アジェンダ
    2
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  3. 本⽇お伝えしたいこと
    全体的にお伝えしたいポイント
    ・Standardizationの⽬的は変数Lで調整してMarginal effectを推定すること!(13.1)
    ・Standardized meanは変数Lの数が多かったり連続値であったりすると⼤変! (13.2, 13.3)
    →モデリングを⾏って推定し計算を楽にする
    ・StandardizationとIP Weightingの結果はモデルを使⽤する場合、⼀般的に異なる(13.4)
    →解析の際はStandardizationとIP Weightingどちらもやってみたほうがいい
    →可能であればDoubly robust estimationもやってみたほうがいい
    ・モデルによって推定する場合のデメリットはその妥当性を⽰すのが困難であること(13.5)

    View Slide

  4. アジェンダ
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2
    4

    View Slide

  5. 13.1 Standardization as an alternative to IP weighting
    13.1で理解すべきポイント
    ・Standardizationの⽬的は変数Lで調整してMarginal effectを推定すること!
    ※⽬的はIP weightingと同じ
    ・Standardized meanは以下の式で計算することができる
    ・Lがcontinuousの場合以下の式で計算することができる
    = - = , = 0, = ] × Pr =
    :
    = ; = , = 0, = ] ×
    =

    View Slide

  6. 13.1 Standardization as an alternative to IP weighting
    Chapter 12にてIP weightingを⽤いて、禁煙が体重増加におよぼすaverage causal effectを推定した。
    ※以下の変数Lで調整し、conditional exchangeabilityを仮定した。
    >?@,A?B − [>?B,A?B] ※a: treatment
    c: cencering
    Average causal effectの定義:
    Sex Age Race
    Education intensity and duration of smoking
    physical activity in daily life recreational exercise
    weight
    6

    View Slide

  7. 13.1 Standardization as an alternative to IP weighting
    Chapter 13ではStandardizationを⽤いて、禁煙が体重増加におよぼすaverage causal effectを推定する。
    データ仕様書(n=1566)※打ち切りがなかった例数
    項⽬ 型 詳細
    Weight gain Number
    Smoking cessation Category 0: untreated、1: treated
    Age Integer
    Sex Category 0: male、1: female
    Race Category 0: white、1: other
    Education Category 5 categories
    Weight Number kg
    Intensity of smoking Number number of cigarettes per day
    duration of smoking Number years of smoking
    Physical activity in daily life Category 3 categories
    Recreational exercise Category 3 categories
    Baseline Characteristic
    7

    View Slide

  8. 13.1 Standardization as an alternative to IP weighting
    Standardizationの⽬的
    変数Lで調整してMarginal effectを推定すること!
    ※変数Lで調整した場合にexchangeabilityとpositivityが成⽴していることを条件とする
    全体の集団
    男性のsubset
    ⼥性のsubset
    禁煙する
    禁煙しない
    禁煙する
    禁煙しない
    40%
    60%
    E = 1 = 1, = 0, = 0] = E >?@,A?B = 1 = 0 =
    1
    4
    E = 1 = 0, = 0, = 0] = E >?B,A?B = 1 = 0 =
    1
    4
    E = 1 = 1, = 0, = 1] = E >?@,A?B = 1 = 1 =
    2
    3
    E = 1 = 0, = 0, = 1] = E >?B,A?B = 1 = 1 =
    2
    3
    E[>?@,A?B] = E >?@,A?B = 1 = 0 ∗ Pr = 0 + E >?@,A?B = 1 = 1 ∗ Pr = 1 =
    1
    4
    ∗ 0.4 +
    2
    3
    ∗ 0.6 = 0.5
    E[>?B,A?B] = E >?B,A?B = 1 = 0 ∗ Pr = 0 + E >?B,A?B = 1 = 1 ∗ Pr = 1 =
    1
    4
    ∗ 0.4 +
    2
    3
    ∗ 0.6 = 0.5
    O[PQRS,TRU]
    O[PQRU,TRU]
    = 1 ※禁煙することは体重増加に影響がない
    8

    View Slide

  9. 13.1 Standardization as an alternative to IP weighting
    Standardizationの⽬的
    変数Lで調整してMarginal effectを推定すること!
    ※変数Lで調整した場合にexchangeabilityとpositivityが成⽴していることを条件とする
    全体の集団
    男性のsubset
    ⼥性のsubset
    禁煙する
    禁煙しない
    禁煙する
    禁煙しない
    40%
    60%
    E = 1 = 1, = 0, = 0] = E >?@,A?B = 1 = 0 =
    1
    4
    E = 1 = 0, = 0, = 0] = E >?B,A?B = 1 = 0 =
    1
    4
    E = 1 = 1, = 0, = 1] = E >?@,A?B = 1 = 1 =
    2
    3
    E = 1 = 0, = 0, = 1] = E >?B,A?B = 1 = 1 =
    2
    3
    E[>?@,A?B] = E >?@,A?B = 1 = 0 ∗ Pr = 0 + E >?@,A?B = 1 = 1 ∗ Pr = 1 =
    1
    4
    ∗ 0.4 +
    2
    3
    ∗ 0.6 = 0.5
    E[>?B,A?B] = E >?B,A?B = 1 = 0 ∗ Pr = 0 + E >?B,A?B = 1 = 1 ∗ Pr = 1 =
    1
    4
    ∗ 0.4 +
    2
    3
    ∗ 0.6 = 0.5
    O[PQRS,TRU]
    O[PQRU,TRU]
    = 1 ※禁煙することは体重増加に影響がない
    9
    Standardized mean

    View Slide

  10. 13.1 Standardization as an alternative to IP weighting
    Lの変数を2つに増やしてみる
    全体の集団
    男性のsubset
    ⼥性のsubset
    禁煙する
    禁煙しない
    禁煙する
    10%
    Otherのsubset
    Whiteのsubset
    Otherのsubset
    Whiteのsubset
    禁煙しない
    禁煙する
    禁煙しない
    禁煙する
    禁煙しない
    30%
    40%
    20%
    L=0
    L=0
    L=1
    L=1
    L=2
    L=2
    L=3
    L=3
    E[>?@,A?B] = - = , = 0, = ] × Pr = =
    : 10

    View Slide

  11. 13.1 Standardization as an alternative to IP weighting
    Lがcontinuousだったら・・・?
    E[>?@,A?B] = - = , = 0, = ] × Pr = =
    :
    E[>?@,A?B] = ; = , = 0, = ] ×
    =

    Probability density function(PDF)
    11

    View Slide

  12. アジェンダ
    12
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  13. 13.2 Estimating the mean outcome via modeling
    13.2で理解すべきポイント
    ・Confounder Lの数が多かったり変数に複数のレベルがある場合、層の数が多くなって計算が⼤変!
    ・モデリングによってConditional meanを推定することが可能!
    →計算が楽に!
    ・ここで推定したConditional meanを使ったStandardized meanを推定する⽅法は13.3で・・・

    View Slide

  14. 13.2 Estimating the mean outcome via modeling
    理想的には以下のようにnonparametricallyにConditional meanを推定したいが・・・
    全体の集団
    男性のsubset
    ⼥性のsubset
    禁煙する
    禁煙しない
    禁煙する
    禁煙しない
    40%
    60%
    E = 1 = 1, = 0, = 0] = E >?@,A?B = 1 = 0 =
    1
    4
    E = 1 = 0, = 0, = 0] = E >?B,A?B = 1 = 0 =
    1
    4
    E = 1 = 1, = 0, = 1] = E >?@,A?B = 1 = 1 =
    2
    3
    E = 1 = 0, = 0, = 1] = E >?B,A?B = 1 = 1 =
    2
    3
    Conditional mean
    ・Confounder Lの数が多い
    ・変数に複数のレベルがある
    数百万層あるのに対象者が数百⼈しかいない
    なんてことも・・・
    14

    View Slide

  15. 13.2 Estimating the mean outcome via modeling
    モデリングによってConditional meanを推定する。
    モデル:
    ℎ = + @
    ∗ + _
    ∗ + `
    ∗ _ + ⋯
    +b
    ∗ ∗
    ⽬的変数:weight gain、
    説明変数:治療Aおよび9つの交絡因⼦L(2次項、交互作⽤項含む)
    age
    E[Y |A = 1, C = 0, L = l]
    上記モデルによって、各共変量とmean outcomeの
    間のconditional relationを放物曲線で表すことが可能(右図)
    conditional relation between age and the mean outcome
    ※この時、mean outcomeに対するageの寄与は
    他の共変量の寄与から独⽴している
    ^
    15

    View Slide

  16. 13.2 Estimating the mean outcome via modeling
    モデルおよび今回のデータをもとに、AとLの値の組み合わせごとにConditional meanの推定値を得た。
    ※すなわちtreatedの403⼈とuntreatedの1163⼈のConditional meanの推定値を得た
    例:
    non-quitter
    , male
    , white
    , age 26
    , college dropout
    , 15 cigarettes/day
    , 12 years of smoking habit
    , moderate exercise
    , very active
    , weight 112 kg
    ただし、本当に知りたいのはStandardized mean・・・
    = 1, = 0, = ] = 0.34
    ^
    E[>?@,A?B] = - = , = 0, = ] × Pr =
    :
    E[>?@,A?B] = ; = , = 0, = ] ×
    =

    Standardized mean
    16

    View Slide

  17. アジェンダ
    17
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  18. 13.3 Standardizing the mean outcome to the confounder distribution
    13.3で理解すべきポイント
    ・13.2で推定したConditional meanの加重平均でStandardized meanを推定することが可能
    ・具体的には以下の4つのステップで推定を⾏う
    ①データセットの拡張
    ②モデリング
    ③予測
    ④平均によるStandardization
    Standardized mean = E[>?@,A?B] = - = , = 0, = ] × Pr =
    :

    View Slide

  19. 13.3 Standardizing the mean outcome to the confounder distribution
    Standardized meanはConditiondal meanの加重平均である
    Standardized mean = E[>?@,A?B] = - = , = 0, = ] × Pr =
    :
    ※Lが離散の場合、Pr = はそのサブセットの対象者が占める割合となる(P.7の通り)
    ※Lが多くなれば多くなるほどnonparametricに算出することがとても⾯倒に・・・
    実はこれは問題とする必要がない!
    19
    - = , = 0, = ] × Pr = = [ = , = 0, ]] =
    1

    - = , = 0, b
    ]
    m
    b?@
    :
    これだけ推定できればいい!
    ※nは研究対象者の数

    View Slide

  20. 13.3 Standardizing the mean outcome to the confounder distribution
    実際に以下4つのStepでTable 2.2に適⽤してみる
    ①データセットの拡張
    ②モデリング
    ③予測
    ④平均によるStandardization
    20

    View Slide

  21. 13.3 Standardizing the mean outcome to the confounder distribution
    使⽤するコード:What Ifで提供されているRのサンプルコード
    使⽤するデータ:What Ifで提供されているNHEFSのデータ
    ⓪サンプルデータの作成
    21

    View Slide

  22. 13.3 Standardizing the mean outcome to the confounder distribution
    ①データセットの拡張
    22
    A=0、YをNullにする A=1、YをNullにする
    Copy
    ※Second blockはA=0の時の、Third blockはA=1の時のStandardized meanを推定するために⽤いる

    View Slide

  23. 13.3 Standardizing the mean outcome to the confounder distribution
    ①データセットの拡張
    23

    View Slide

  24. 13.3 Standardizing the mean outcome to the confounder distribution
    ②モデリング
    AとLを与えた時のmean outcomeの値を予測するための回帰モデルを先の3つのデータセットに当てはめる
    モデル:
    24
    Y = + @
    ∗ ∗
    積項を⼊れて飽和させる
    ※3つのデータセットに当てはめても実際のパラメータ推定に使えるのはオリジナルのデータセットのみ
    (Second, Third blockはYが⽋損しているため)
    ※αと各βの値を推定することでYを予測するモデル式が得られる
    今回はRを⽤いて右のようにパラメータを推定した

    View Slide

  25. 13.3 Standardizing the mean outcome to the confounder distribution
    25
    ③予測
    ②で推定したパラメータをもとに、Second, Third blockのYを予測する
    Second block Third block

    View Slide

  26. 13.3 Standardizing the mean outcome to the confounder distribution
    26
    ④平均によるStandardization
    ③で得たSecond, Third blockのYを予測値の平均値を計算し、Standardized meanを得る
    ※今回、L=1が60%、L=0が40%であるため、L=1の⾏に多くの重みが与えられる
    今回計算した結果、いずれも0.5となり、Chapter 2.3の結果と⼀致している!

    View Slide

  27. 13.3 Standardizing the mean outcome to the confounder distribution
    NHEFSのデータのように⾼次元のLがある場合にもこの⼿法は使える!
    使⽤するデータ:What Ifで提供されているNHEFSのデータ
    ⓪データの読み込み
    27

    View Slide

  28. 13.3 Standardizing the mean outcome to the confounder distribution
    ①データセットの拡張
    28

    View Slide

  29. 13.3 Standardizing the mean outcome to the confounder distribution
    29
    ②モデリング
    ℎ = + @
    ∗ + _
    ∗ + `
    ∗ _ + ⋯
    +b
    ∗ ∗
    モデル

    View Slide

  30. 13.3 Standardizing the mean outcome to the confounder distribution
    30
    ③予測
    ②で推定したパラメータをもとに、Second, Third blockのYを予測する

    View Slide

  31. 13.3 Standardizing the mean outcome to the confounder distribution
    31
    ④平均によるStandardization
    ③で得たSecond, Third blockのYを予測値の平均値を計算し、Standardized meanを得る
    今回の平均因果効果は5.18-1.66=3.52kg(95%CI: 2.6 - 4.5)となった
    ※平均因果効果の95%信頼区間はbootstrappingを⾏い、算出した(詳しくはTechnical point 13.1を参照)
    素朴な疑問。。。(どなたか詳しい⽅にご教⽰いただきたいです・・・)
    過学習している場合(または学習⾜りていないときも) = , = 0,b
    ]の予測値の信頼性が低い気がす
    るが対策って必要無い?

    View Slide

  32. アジェンダ
    32
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  33. 13.4 IP weighting or standardization?
    13.4で理解すべきポイント
    ・StandardizationとIP Weightingの結果はモデルを使⽤する場合、⼀般的に異なる
    ・解析の際はStandardizationとIP Weightingどちらもやってみたほうがいい
    ・可能であればDoubly robust estimationもやってみたほうがいい

    View Slide

  34. 13.4 IP weighting or standardization?
    34
    Chapter2でやったようにStandardized meanとIP weightingは等しい!
    ※ただし、このように等しくなるのはそれらを推定する際にモデルが⽤いられていない時だけ!
    モデルで推定する場合、以下のように利⽤するモデルが異なるため、最終アウトプットは⼀般的に異なる!
    ■IP weightingの場合:
    Pr[A = a, C = 0 | L]をPr[A = a | L]およびPr[C = 0 | A = a, L]から推定
    ※Pr[A = a | L]およびPr[C = 0 | A = a, L]はlogistic regression modelを当てはめて推定(Chapter 12)
    ■Standardizationの場合:
    E[Y | A = a, C = 0, L = l]をparemetric linear regression modelを当てはめて推定(Chapter 13)

    View Slide

  35. 13.4 IP weighting or standardization?
    35
    Q. 結局IP weightingとStandardizationはどちらで計算したらいいの??
    A. どちらでも計算してみましょう!!
    どちらでやるにしてもモデルのmisspecificationを避けることは難しい・・・。
    かつ、misspecificationが起きているかもわからない・・・。
    →⼆つのアプローチで評価することで、もし結果が⼤きく異なれば少なくとも⽚⽅は
    深刻なmisspecificationを起こしていると評価可能!!
    ※もちろん結果が⼀致している場合にどちらのモデルもmisspecificationを起こしている可能性はある
    ※Fine point 13.2のdoubly robust estimationを⽤いると、いずれか⽚⽅で正しくモデルを設定できていれば
    正しい因果効果を推定することが可能

    View Slide

  36. 13.4 IP weighting or standardization?
    36
    Standardizationはplug-in g-formulaと⾔われる
    理由:g-formulaのconditional mean outcomeを
    その推定値で置き換えているため
    ※本章のように推定値がparametric modelから得られる場合
    parametric g-formulaと呼ばれる
    g-formula
    簡単に以下のようなDAGを考える
    E[YX
    ]
    = Σc
    E[YX
    , C] #Law of total probability
    = Σc
    E[YX
    | C]Pr[C] #Chain rule
    = Σc
    E[YX
    | X, C]Pr[C] #conditional independence(※)
    = Σc
    E[Y | X, C]Pr[C] #consistency
    ※Cで全てのバックドアパスを閉じられると仮定している
    ため、conditional independenceが成⽴
    Y
    X
    C
    ■Parametric g-formula
    ・AとLで層別化した時のoutcomeの分布の関数(確率密度
    関数など)から得られた推定値を利⽤してstandardized
    valueを計算する⼿法
    ・時間依存性共変量が存在しない場合は、Lの分布の
    parametric modelingを必要としない(?)

    View Slide

  37. 13.4 IP weighting or standardization?
    結論:
    IP weightingとStandardizationはどちらかではなく、可能であればどちらもやったほうがいい!
    ※また、さらに可能であればDouble robust methodも使⽤する(Fine point 13.2 or Technical point 13.2)
    最後に・・・
    今回は全体のaverage causal effectを推定したけど、特定のサブセットに限定したaverage causal effectも
    計算可能である。
    その際は計算対象のサブセットを限定するだけで、その他は全て同じやり⽅で実施可能である!

    View Slide

  38. アジェンダ
    38
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  39. 13.5 How seriously do we take our estimates?
    13.5で理解すべきポイント
    ・モデルを⽤いて推定した場合、その結果の妥当性を⽰すことは難しい。
    ・少なくとも以下の3点が成⽴することを⽰すことが重要。
    ①exchangeability, positivity, and consistency
    ②変数が正しく測定されていること
    ③モデルが正しいこと

    View Slide

  40. 13.5 How seriously do we take our estimates?
    40
    推定値の妥当性を⽰すのはとても⼤変!!
    以下の3つの条件が少なくとも近似的に成⽴することを⽰すことが⼤切!
    ①exchangeability, positivity, and consistency
    ②変数が正しく測定されていること
    ③モデルが正しいこと

    View Slide

  41. 13.5 How seriously do we take our estimates?
    41
    ①exchangeability, positivity, and consistency
    ■exchangeabilityについて
    今回の例で⾔えば、9つの測定された共変量Lの下、Conditional Exchangeabilityが成⽴している必要あり!
    ※ E[Ya | A = 1] = E[Ya | A = 0]
    Sex=M Age=25 ・・・ +3kg
    条件A
    Sex=F Age=32 ・・・ +2.3kg
    条件B
    条件Aの⼈が仮に条件Bを与えられた場合にoutcomeの値が実際の条件Bの⼈と同じく+2.3kgとなるイメージ!

    View Slide

  42. 13.5 How seriously do we take our estimates?
    42
    測定されていない交絡
    ①exchangeability, positivity, and consistency
    Exchangeabilityを妨げる要因
    Selection bias
    これらがあると、E[Ya | A = 1] = E[Ya | A = 0]が成⽴しない!

    View Slide

  43. 13.5 How seriously do we take our estimates?
    43
    ①exchangeability, positivity, and consistency
    ■positivityについて
    A = 1とA = 0の時で共変量Lの分布が完全にオーバーラップしていないといけない!
    オーバーラップしていない区間
    オーバーラップしていない区間
    ※Positivityが成⽴していない例のイメージ

    View Slide

  44. 13.5 How seriously do we take our estimates?
    44
    ①exchangeability, positivity, and consistency
    ■consistencyについて
    実際に観測される値とcounterfactual outcomeが等しいこと。
    ※E[Ya | A = a] = E[Y | A = a]
    ■注意点
    本章で取り扱っているそれぞれの介⼊(禁煙するorしない)には複数の⽅法があることが⾒込まれる。
    ランダム化によって偏りなく割り付けている想定(この想定が崩れるとconsistencyが成⽴しない)
    介⼊グループ 想定される介⼊⽅法
    禁煙するグループ 段階的に喫煙を減らす
    ある⽇から突然喫煙をやめる
    禁煙しないグループ 喫煙を増やす
    喫煙を減らすが0にはしない

    View Slide

  45. 13.5 How seriously do we take our estimates?
    45
    ②変数が正しく測定されていること
    A、Y、または交絡因⼦Lの系統的な測定誤差は⼀般的にbiasをもたらす!
    ※なのでどのように測定したのかのmethodの記載が重要と考える
    ③モデルが正しいこと
    たとえば本章では以下のように2次式でモデル指定していたが、本当は3次、4次の関連がある場合、
    交絡を完全に調整しない。
    ※Lに全ての交絡因⼦が指定され誤りなく計測されていたとしてもモデル式が誤っていたらbiasをもたらす
    ℎ = + @
    ∗ + _
    ∗ + `
    ∗ _ + ⋯
    +b
    ∗ ∗
    ⽬的変数:weight gain、
    説明変数:治療Aおよび9つの交絡因⼦L(2次項、交互作⽤項含む)

    View Slide

  46. 13.5 How seriously do we take our estimates?
    46
    これらの条件が成⽴していることを⽰すことができればデータ分析は簡単!!!!
    →簡単に⽰すことができないから難しい・・・。批判されても反論が難しい・・・
    ※たとえば、モデルの仕様については感度解析などで妥当性を⽰すことはできるけど、測定されていない
    交絡を⾔い出すとキリがない・・・
    因果推論のタスクは先述の条件がほぼ満たされているという仮定に基づき
    counterfactual outcomeの⽋如を補っている
    =これらの条件から逸脱すればするほど推定される効果はbiasを含む!!
    =これらの条件が成⽴しているか懐疑的になって議論する必要がある!!

    View Slide

  47. アジェンダ
    47
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  48. Fine Point 13.1
    48
    PositivityはIP weightingと同様にStandardizationでも必要である。
    ※Pr[A = a | L = l] = 0 and Pr[L = l] = 0の場合E[Y | A = a, L = l]がundefinedとなるため
    ただし、StandardizationとIP weightingではPositivity違反の影響が異なる
    理由:parametric modelで外挿すればpositivityの違反を無視できるため
    ※ただし、推定にbiasを持ち込むので95%信頼区間で真の効果を推定することを⾏う
    age
    E[Y |A = 1, C = 0, L = l]
    conditional relation between age and the mean outcome
    ^
    48
    外挿
    注意点:
    ①外装はあくまでデータが無限にあっても推定できない
    区間の推定を⽬的に⾏う
    ※データ量不⾜を補うものではない
    =「外挿できるからデータ量は少なくても良い」は成⽴しない
    ②このことがIP weightingよりStandardizationを推奨
    することにならない
    =標準誤差が⼩さくなるがbiasを含む。Biasが標準誤差
    よりも多くの推定の誤りを⽣むことも・・・

    View Slide

  49. アジェンダ
    49
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  50. Technical Point 13.1
    50
    前提:
    効果の推定値は標準誤差や95%信頼区間などのランダム性の変動を考慮して表現される
    正確な推定値を得ることは難しいので、⼤規模サンプルの場合簡単に計算可能な分布への近似によって
    計算されることが多い。
    50
    複雑すぎて⼤規模サンプルでも簡単に計算可能な分布への近似が困難である場合がある。
    →Bootstrappingを⾏い標準誤差および95%信頼区間を推定する!!

    View Slide

  51. Technical Point 13.1
    51
    51
    Bootstrappingの考え⽅
    研究対象
    (1629⼈)
    Bootstrap sample1
    (1629⼈)
    Bootstrap sample2
    (1629⼈)
    Bootstrap sample1000
    (1629⼈)



    ATE1
    ATE2
    ATE1000
    ・得られたデータから得られたデータの同数だけランダムに復元抽出する(※データの重複を許容)
    ・それぞれのBootstrap sampleの興味のあるATEを算出
    ・ATEの標準偏差=標準誤差、標準誤差を±1.96倍すると95%信頼区間の推定になる(正規近似)
    51

    View Slide

  52. Technical Point 13.1
    52
    52
    注意点:
    ・⼤規模なデータセットで推定を⾏う場合、計算量が多くなる可能性がある
    →200〜500程度のbootstrap sampleで推定された推定値を参照することはよくある
    ・Bootstrappingはある程度⼤規模なデータセットでないと⾏えない

    View Slide

  53. Technical Point 13.1
    53
    サンプルコードで95%信頼区間を算出する(※コードの説明は別途⾏う)
    結果がテキストと異なるのは確率的にサンプルを作成しているためと思われる

    View Slide

  54. アジェンダ
    54
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  55. Fine Point 13.2
    55
    55
    本章で挙げられていた問題点
    ①モデルのmisspecificationを起こす可能性がある
    →IPWとStandardizationどっちも⾏って感度解析する
    ②IPWとStandardizationの結果が異なる場合、どちらが正しいのかわからない(どっちも間違えてるかも)
    →Doubly robust estimatorで推定してみる

    View Slide

  56. Fine Point 13.2
    56
    56
    Doubly robust estimator
    共変量L
    介⼊A 効果Y
    Model②:E[Y | A = a, L]をモデル化
    Model①:Pr[A = a | L = l]をモデル化
    Model①、Model②のいずれかが正しい場合、正しい因果効果を得ることが可能

    View Slide

  57. Fine Point 13.2
    57
    57
    計算⽅法
    1. Model①を作成する
    Chapter 12のようにIP weightであるp = 1/ )を計算する
    2. Model②を作成する
    本Chapterで説明したように⼀般化線形モデルでE[Y | A = a, L = l, R]をモデル化する。
    ※ R = t
    p( = 1)
    −p ( = 0)
    3. Model②の予測値を利⽤してA=1およびA=0でのStandardized meanを取得する

    View Slide

  58. Fine Point 13.2
    58
    58
    Doubly robust estimationについてまとめ
    ・IP WeightingとStandardizationのどちらかのモデルが正しければ、正しい因果効果を得られる
    =どちらのモデルでもmisspecificationしている場合、正しい因果効果を得られない!!
    ・IP WeightingとStandardizationのどちらが正しいモデルなのかを意識する必要がない!
    個⼈的な疑問(時間があったらシミュレーションする→すみません時間とれませんでした)
    前提:IP WeightingとStandardizationのいずれかのモデルが正しい=Doubly robust estimationの結果と
    どちらか(もしくはどちらも)⼀致する
    ・IP WeightingとStandardizationのどちらのモデルも誤っていた場合、Doubly robust estimationは
    IP WeightingまたはStandardizationの結果と⼀致する?
    ・⼀致しない場合、どちらのモデルも誤っていたという結論を出せるので、IP Weightingおよび
    Standardizationの結果と⽐較してみたほうが良いと考える

    View Slide

  59. アジェンダ
    59
    • 13.1 Standardization as an alternative to IP weighting
    • 13.2 Estimating the mean outcome via modeling
    • 13.3 Standardizing the mean outcome to the confounder distribution
    • 13.4 IP weighting or standardization?
    • 13.5 How seriously do we take our estimates?
    • Fine Point 13.1
    • Technical Point 13.1
    • Fine Point 13.2
    • Technical Point 13.2

    View Slide

  60. Technical Point 13.2
    60
    60
    前提:positivityとexchangeabilityを満たすA、Y、Lがあるとする。
    その時のE[Ya = 1]におけるcounterfactual mean outcomeを推定する
    E[Ya = 1]はE[b(L)]と書くことができる。この時b(L)は以下のいずれかで表現される
    b(L) = E[Y | A=1 , L] or E pP
    v =
    ※ここで = Pr A = 1 L]
    本Chapterではplug-in g-formula estimatorである@
    m

    | b
    m
    b?@
    について の推定値を研究対象者の数nで
    平均を取った値で置き換えられることを説明した
    ※ は linear regression modelによって推定する
    ※IP weightingの場合は@
    m
    ∑ p•P•
    v
    ‚ =•
    について、
    m
    b?@
    ( で推定)の推定値を
    研究対象者の数nで平均を取った値で置き換えられることを説明した

    View Slide

  61. Technical Point 13.2
    61
    61
    推定値(
    | または
    ƒ )と実際の値(()または )が離れれば離れるほどbiasが⼤きくなる!!
    →E[Ya = 1]を推定する際のDoubly robust estimatorは
    | と
    ƒ をいい感じに組み合わせる!!
    =outcome regressionをtreatment modelで補正する(Horvitz-Thompson推定量による補正とも取れる)
    E[Ya = 1]のDoubly robust estimatorは以下のように表すことができる

    |[>?@]„…
    =
    1

    -
    | b
    +
    b

    ƒ b
    b

    | b
    =
    m
    b?@
    1

    -
    b
    b

    ƒ b
    − (
    b

    ƒ b
    − 1)
    | b
    m
    b?@
    また、その時のbiasはlarge sampleの場合以下のように表すことができる
    [
    |[>?@]„…
    − [>?@]] = [()(
    1


    1

    )( − ∗())]
    ※∗ と∗()はprobability limits。Modelが正しい場合に∗ = 、∗ = ()

    View Slide

  62. Technical Point 13.2
    62
    62
    先ほどのbiasの式を再度⽰す
    [
    |[>?@]„…
    − [>?@]] = [()(
    1


    1

    )( − ∗())] ※∗ と∗()はprobability limits
    Modelが正しい場合に∗ = 、∗ = ()となるため、どちらかのモデルが正しければ、biasは0となる
    (どちらが正しいかを知る必要はない)
    ※もちろんLが⾼次元であることでこのbiasが⼤きくなる場合、
    parametric modelが正しくなることは期待できない・・・
    ただし、Doubly robust estimationの場合、biasが誤差の積に依存する特性がある。
    この特性により、machine learning estimatorを⽤いて と()を推定することでbiasが⼩さい
    Doubly robust estimatorを得ることができる。
    理由:high-dimentional settingにおいては複雑なアルゴリズムに基づくmachine learningの⽅がより
    正確な推定値を返すため(ただし、データ量が多いことが条件)

    View Slide