$30 off During Our Annual Pro Sale. View Details »

G-estimation and Structural nested mean model(Causal inference: What if, Chapter 14)

Shuntaro Sato
November 25, 2020

G-estimation and Structural nested mean model(Causal inference: What if, Chapter 14)

Keywords: 因果推論, G-estimation, Structural nested mean model, Rank-preserving model

Shuntaro Sato

November 25, 2020
Tweet

More Decks by Shuntaro Sato

Other Decks in Science

Transcript

  1. 東京大学医学系研究科博士課程
    三谷知広 (@m_tomo_)
    1
    Chapter 14
    G-ESTIMATION AND
    STRUCTURAL
    NESTED MEAN
    MODEL

    View Slide

  2. Chapter 14 G-ESTIMATION OF STRUCTURAL NESTED
    MODELS
    • g-methods
    • IP weighting
    • standardization
    • g-estimation
    • この3つは時間依存性の介入などに対するgeneralizedな治療効果を算出する手法。
    どれも前提とするモデルの仮定は異なる。
    • g-methodsをPart IIの時間依存でない治療に適用するのはoverkill
    • でも、Part IIIで必要になるので、まずは単純な場面で解説しておく
    • g-estimationは、structural nested model(後述)のパラメータを推定する手法。
    • g-estimationは以下のパーツから構成される。
    • Conditional exchangeability (14.2)
    • Structural nested models (14.3)
    • Rank-preserving models (14.4)
    2

    View Slide

  3. 14.1 The causal question revisited
    • 12章、13章:25-74歳の喫煙者1566人について、喫煙中止Aが体重増加Yに与える因
    果効果を推定した。
    • ただし、Conditional exchangeability on the L vairablesを仮定:性別、年齢、人種、教
    育、喫煙の程度、日々の生活強度、運動習慣、体重
    • Average causal effect on the difference scale: =1,=0 − =0,=0
    • 場合によっては一部の集団についてのcausal effectを考えることもできる
    例: =1,=0 − =0,=0
    =1,=0 = 45 − =0,=0 = 45
    =1,=0 − =0,=0
    • Product termを含んだmarginal structural models (12章)を用いたり、
    standardizationを特定のsubsetのみに適用(13章)したりすることで推定できる。
    • Lのそれぞれの層における因果効果( =1,=0 − =0,=0 )の推定は?
    • 12.5章ではLの全てのproduct termを含んだfaux marginal structural modelを紹介
    • この章では、g-estimationで =1,=0 − =0,=0 を推定する
    3

    View Slide

  4. 14.1 The causal question revisited
    4
    • Faux marginal structural modelの復習
    • IP weightingせずに、linear regression modelからパラメータ推定できる

    View Slide

  5. 14.1 The causal question revisited
    14章のゴール
    (g-estimationを用いて)Lで条件づけたときの平均因果効果を求める
    =1,=0 − =0,=0
    ※ average causal effectではないことに注意。
    5

    View Slide

  6. • この節では、conditional exchangeabilityを満たすための(必要)条件を検討する。
    • Conditional exchangeability: ⊥ | ℎ = 1 = 0
    • まず、=0について考える。 Conditional exchangeabilityが成立しているとき、Lに
    加えて=0がわかってもA=0かA=1を予測する材料にはならない。これは、
    =0| = 0, の分布と、 =0| = 1, の分布が等しく、全ての =0において、
    Pr = 0 =0, = Pr[ = 0|]になるから。
    • =0 ⊥ | ( ∈ 0,1 )
    • ⇔ Pr =0 = 0, = Pr =1 = 1,
    • ⇔ Pr = 0 =0, = Pr = 0
    14.2 Exchangeability revisited
    6

    View Slide

  7. 14.2 Exchangeability revisited
    • ⇒ =0を知っていて、真のモデルが以下のとき、
    = 1 = 0
    + 2

    = 1 =0, = 0
    + 1
    =0 + 2

    のパラメータを推定すると、1
    はどうなるか? → 1
    = 0
    • ここで「逆」の発想。 1
    = 0になるなら、正しい=0なのではないか?
    ※「逆」なので必ずしも成立しません。しかし、 がパラメータで表現され、そのパラメータの範囲内で1
    = 0に
    なるが唯一であれば、それが正しいではあるはずです。
    7

    View Slide

  8. Technical Point 2.1 mean exchangeability再訪
    8
    Full exchangeabilityは成立しない
    が、exchangeabilityは成立する例。
    下剋上させる治療?

    View Slide

  9. Technical Point 2.1 mean exchangeability再訪
    • Exchangeabilityを満たすがfull exchangeabilityを満たさないとき:個々のY^(a=0)、
    Y^(a=1)はAと独立だが、joint distributionは独立でない。
    9

    View Slide

  10. Technical Point 2.1 mean exchangeability再訪
    • 少なくとも(g-estimationを含む)ここまでに出てきた手法においては、分布は不問
    でmean exchangeabilityが成立していればok
    • 当然、full exchangeability (joint exchangeability)も必須ではない
    • =0 = 1, = [=1| = 0, ]が成立していればok
    • ※ただ、そもそも因果効果を考える場合にfull exchangeabilityが成立するようにLを選ぶ方が良いと思いま
    すし、meanだけ成立させる方が難しいかもしれません。
    10

    View Slide

  11. 14.3 Structural nested mean models
    • 求めたいもの: =1 − =0 = [=1 − =0|]
    • もしeffect-measure modificationがなければ、
    =1 − =0 = 1
    − =0 = 1

    • Effect modificationがある場合には例えば、
    − =0 = , = 1
    + 2

    • これらがstructural nested mean model.
    ※なぜ「nested」というのかは、time-varying treatmentを扱って初めて分かります、とのこと。
    • 対称となる治療(ここではa=0) のアウトカムと差の期待値(mean)をaとLでモデル化
    • 他の例:が”change in smoking intensity”などのcontinuous treatment variables
    − =0 = , = 1
    + 2
    2 + 3
    + 4
    2
    • なお、g-estimationではcensoringに対応できないのでIP weightingでcensoringなし
    のpseudo-populationを作成したあとでg-estimationを使う必要がある。このセク
    ションではc=0を表記せずに進める。
    11
    =0 の部分をモデル化
    しなくて良いので、
    standardizationよりパラ
    メータが少ない
    =誤特定リスク小!
    βは線形

    View Slide

  12. 14.4 Rank preservation
    12
    • 続いて、structural nested mean modelを満
    たす =0をモデル化するための部品
    • Rank-preserving modelは非現実的だが簡
    単でわかりやすい。
    • − =0 をg-estiamtionで求めるとき、
    実は = , さえ等しければ分布は
    関係ない。

    View Slide

  13. 14.5 G-estimation
    • いよいよ本番!これまでの3セクションの内容を合体させるよ!
    • ゴール:structural nested mean model − =0 = 1
    のパラメータ推定
    • ここで、additive rank-preserving model

    =0 = 1
    を考える。このモデルにお
    いては、全員のindividual causal effectは1
    で一定。 − =0 = 1
    となる。


    =0 = 1
    ⇔ =0 = − 1
    ⇒ =0 = − 1

    • もし、 1
    がわかればcounterfactual =0が計算できる!
    • 友人「 問題です!1
    は† = −20, 0, 10のどれかだよ。どれでしょう!」
    → =0の候補として、 † = − †を計算し、
    = 1 =0, = 0
    + 1
    † + 2

    のパラメータ推定を行う。 1
    がゼロになる†が真の1

    13
    知りたいのは
    あくまで平均

    View Slide

  14. 14.5 G-estimation
    • 実際には候補を示してくれる友人はいない。
    • それなら、全探索!Machine powerで殴ろう!
    • そもそも1
    は因果効果であり、ありえそうな範囲は限定的。そこを細かく探していけ
    ば良い(例:-20~20, 0.01間隔)
    • NHEFSの例
    14
    → H(3.446)でほぼゼロ
    よって、禁煙が体重増加に与える
    平均因果効果1
    = 1
    のg-推定量

    1
    は3.4kg

    View Slide

  15. 14.5 G-estimation
    • g推定量の95%信頼区間:
    1
    = 0を検定して、有意水準0.05で棄却されない†の範囲
    (censoringの補正にIP-weightingを用いている時はa robust variance estimatorを
    用いる。その場合はconservativeな区間が得られる)
    • Bootstrap信頼区間でも問題ない。この場合はnon-conservative/narrower。
    15
    → 95%信頼区間:2.5~4.5

    View Slide

  16. 14.5 G-estimation
    • Non-rank-preserving modelを再考する。
    • g-estimationでは、structural nested mean
    modelが正しく特定されていることを前提とし
    たが、それは個人因果効果が一定であること
    (つまり、additive rank-preserving modelが正
    しいこと)を必要としない。
    • 全てのLにおいて、 1
    と=0の平均さえ等
    しければOK
    • どういうこと?
    • = 1 =0, = 0
    + 1
    =0 + 2

    • = 1 =0, = 0
    + 1
    † + 2

    • を条件づけたと † の相関を見ている=
    平均が等しければ分布は関係ない
    16

    View Slide

  17. 14.6 Structural nested models with two or more parameters
    • Effect modificationがあるときは?
    • − =0 = , = 1
    + 2

    • g-estimationはconditional causal effectを求めるものであり、もしこの2
    を落と
    してしまうと、biasにつながる
    • これは、effect modificationがある場合であってもmarginal structural mean model
    = 0
    + 1
    は誤特定されておらず、biasを生じないことと対照的。
    • 対応するrank-preserving model:

    =0 = 1
    + 2
    2つのパラメータ
    • = 1 † , = 0
    + 3

    • = 1 † , = 0
    + 1
    † + 2
    † + 3

    • 2次元空間での探索なので、より計算量が必要。でも実はclosed formでも解ける
    (Technical Point 14.2)
    • 極論はLのp個のstrata全てに対して:

    =0 = 1
    + σ
    =1
    2,
    ,
    17
    p+1個のパラメータを持つsaturated model

    View Slide

  18. 14.6 Structural nested models with two or more parameters
    • 2
    † の項が持つ役割の感覚的理解(Vが二値のとき)
    • 大事なこと:g-estimationはconditional exchangeabilityを確かめるものではなく、
    conditional exchangeabilityが成立していることを前提とした手法(p178 コラム)
    • 1
    † のついて1
    = 0になることは、 を条件づけると平均してと † が相
    関しない、ということを示しているに過ぎない。これはconditional exchangeability
    よりだいぶ緩く、条件を使い切ってはいない。
    (つまり、
    = 1
    では、 † = 0, = 1
    < † = 1, = 1
    = 2
    では、 † = 0, = 2
    > † = 1, = 2
    となっていて、全体では相関がない、ということかもしれない。)
    • ここで、2
    † について2
    = 0という条件を加えると、 = 0のときは2
    の推定
    に影響を及ぼさないので、 = 1のサンプルの中で 「を条件づけると平均してと
    † が相関しない」という条件を課すことができる。別の言い方をすると、で重
    み付けをした上で「を条件づけると平均してと † が相関しない」という条件。
    18

    View Slide

  19. 14.6 Structural nested models with two or more parameters
    • In practice, structural nested models with multiple parameters have rarely been
    used.
    • In fact, structural nested models of any type have rarely been used, partly
    because of the lack of user-friendly software and partly because the extension of
    these models to survival analysis requires some additional considerations (see
    Chapter 17). We now review two methods that are arguably the most commonly
    used approaches to adjust for confounding: outcome regression and propensity
    scores.
    • g-estimationの真の姿は、part IIIまで待ちましょう。
    19

    View Slide

  20. F.P.14.1 Relation between marginal structural models and
    structural nested models
    • − =0| = 1
    + 2
    を、Semiparametric marginal structural mean model
    としてIP weightingでパラメータ推定することもできる。
    • =

    • この重み付けをしたpseudo-population上でregressionする。(time-varying
    treatmentがなければ)semiparametric marginal structural mean modelとstructural
    nested mean modelは等価。
    • 同じことを全てのLについての特別なケースで実行すると、
    • − =0| = 1
    + 2

    • =
    = 1
    • → faux semiparametric marginal structural model
    20

    View Slide

  21. T.P. 14.1 multiplicative structural nested mean model
    • Yが正の値のみを取るとき、Multiplicative structural nested mean model
    • log = ,
    =0 = ,
    = 1
    + 2

    • 対応するrank-preserving model
    • † = −1
    † − 2

    • として、解ける。確率が小さいときの、二値アウトカムもこれでOK。
    • Yが二値のとき、structural nested logistic model
    • = 1 = , − =0 = 1 = , = 1
    + 2

    21

    View Slide

  22. F.P. 14.2 Sensitivity analysis for unmeasured confounding
    • いままでのg-estimationでは1
    = 0と推定されることを前提にしていた。
    • Conditional exchangeabilityが成り立たず、unmeasured confoundingがあったら?
    • この場合、=0とがLを条件づけた上で相関してしまう→ 1
    ≠ 0
    • 想定されるassociationを例えば1
    = 0.1として与えれば良い。
    • 正確には、g-estimationはconditional exchangeabilityを必要とせず、1
    で表される
    nonexchangeabilityの大きさがわかっていれば良い。
    • Unmeasured confoundingがあると想定する場合は1
    についての複数のシナリオを
    用いて、g-estimationを繰り返すことでsensitivity analysisを実行できる。
    22

    View Slide

  23. T. P. 14.2 G-estimation of structural mean models.
    • Structural nested model のパラメータを推定したい。
    • − =0 = , ] = 1

    • Estimating equation (censoringは省略)
    • σ


    = 0
    • = σ −
    σ (− )
    • としてclosed formで計算することができるそうです。
    (申し訳ありませんが、このTechnical Pointはよく分かりませんでした。)
    23

    View Slide

  24. Q&A
    • 疑問1:logistic modelに必要以上のパラメータを投入したらどうなるか
    • (p180) “Because the structural model has two parameters, 1 and 2, we also
    need to include two parameters in the IP weighted logistic model.”
    • 大事なこと:g-estimationはconditional exchangeabilityを確かめるものではなく、
    conditional exchangeabilityが成立していることを前提とした手法(p178 コラム)
    • conditional exchangeabilityが成立する限りにおいて、Lの任意の部分集合V’につい
    て2′
    † ’を追加しても、† = においては2′
    = 0と推定されるはず。
    • しかし、現実にはサンプル数の限界や誤差があるので全てのが同時にゼロになる
    とは限らず、困ってしまいそう。
    24

    View Slide

  25. Q&A
    • 疑問2:logistic modelでeffect modificationを生じるVと違うV’を使ったら?
    • − =0 = , = 1
    + 2



    =0 = 1
    + 2

    = † に対して、
    • = 1 † , = 0
    + 1
    † + 2
    † ′ + 3

    • たいてい大丈夫だが、ダメなこともある。(自信なし。連立方程式の解不定と同様の
    状況が生じうると思います。)
    25

    View Slide

  26. Q&A
    • 疑問3:logistic modelで、 † の一次の項だけ
    でなく、二次や三次の項を追加したら?
    • (少なくともこの章の枠組みでは)ダメ。それは
    † に対して、meanだけではなく分布につい
    ての条件を課すことになる。=0|と=1|の平
    均周りの分布が等しければおそらく問題なし。
    • meanに注目して、meanについてのみ制御できる
    rank preserving modelを用いた。いくら†を調整
    したところで、 † の分散は制御できず、 =
    0にできない可能性がある。
    • causal effectやcounterfactualの分布に興味があ
    る場合は、分布を制御できるmodelを用いて拡張
    できるかもしれない(参考:Technical Point 14.2)
    26

    View Slide