Upgrade to Pro — share decks privately, control downloads, hide ads and more …

G-estimation and Structural nested mean model(C...

Shuntaro Sato
November 25, 2020

G-estimation and Structural nested mean model(Causal inference: What if, Chapter 14)

Keywords: 因果推論, G-estimation, Structural nested mean model, Rank-preserving model

Shuntaro Sato

November 25, 2020
Tweet

More Decks by Shuntaro Sato

Other Decks in Science

Transcript

  1. Chapter 14 G-ESTIMATION OF STRUCTURAL NESTED MODELS • g-methods •

    IP weighting • standardization • g-estimation • この3つは時間依存性の介入などに対するgeneralizedな治療効果を算出する手法。 どれも前提とするモデルの仮定は異なる。 • g-methodsをPart IIの時間依存でない治療に適用するのはoverkill • でも、Part IIIで必要になるので、まずは単純な場面で解説しておく • g-estimationは、structural nested model(後述)のパラメータを推定する手法。 • g-estimationは以下のパーツから構成される。 • Conditional exchangeability (14.2) • Structural nested models (14.3) • Rank-preserving models (14.4) 2
  2. 14.1 The causal question revisited • 12章、13章:25-74歳の喫煙者1566人について、喫煙中止Aが体重増加Yに与える因 果効果を推定した。 • ただし、Conditional

    exchangeability on the L vairablesを仮定:性別、年齢、人種、教 育、喫煙の程度、日々の生活強度、運動習慣、体重 • Average causal effect on the difference scale: =1,=0 − =0,=0 • 場合によっては一部の集団についてのcausal effectを考えることもできる 例: =1,=0 − =0,=0 =1,=0 = 45 − =0,=0 = 45 =1,=0 − =0,=0 • Product termを含んだmarginal structural models (12章)を用いたり、 standardizationを特定のsubsetのみに適用(13章)したりすることで推定できる。 • Lのそれぞれの層における因果効果( =1,=0 − =0,=0 )の推定は? • 12.5章ではLの全てのproduct termを含んだfaux marginal structural modelを紹介 • この章では、g-estimationで =1,=0 − =0,=0 を推定する 3
  3. 14.1 The causal question revisited 4 • Faux marginal structural

    modelの復習 • IP weightingせずに、linear regression modelからパラメータ推定できる
  4. • この節では、conditional exchangeabilityを満たすための(必要)条件を検討する。 • Conditional exchangeability: ⊥ | ℎ =

    1 = 0 • まず、=0について考える。 Conditional exchangeabilityが成立しているとき、Lに 加えて=0がわかってもA=0かA=1を予測する材料にはならない。これは、 =0| = 0, の分布と、 =0| = 1, の分布が等しく、全ての =0において、 Pr = 0 =0, = Pr[ = 0|]になるから。 • =0 ⊥ | ( ∈ 0,1 ) • ⇔ Pr =0 = 0, = Pr =1 = 1, • ⇔ Pr = 0 =0, = Pr = 0 14.2 Exchangeability revisited 6
  5. 14.2 Exchangeability revisited • ⇒ =0を知っていて、真のモデルが以下のとき、 = 1 = 0

    + 2 = 1 =0, = 0 + 1 =0 + 2 のパラメータを推定すると、1 はどうなるか? → 1 = 0 • ここで「逆」の発想。 1 = 0になるなら、正しい=0なのではないか? ※「逆」なので必ずしも成立しません。しかし、 がパラメータで表現され、そのパラメータの範囲内で1 = 0に なるが唯一であれば、それが正しいではあるはずです。 7
  6. Technical Point 2.1 mean exchangeability再訪 • 少なくとも(g-estimationを含む)ここまでに出てきた手法においては、分布は不問 でmean exchangeabilityが成立していればok •

    当然、full exchangeability (joint exchangeability)も必須ではない • =0 = 1, = [=1| = 0, ]が成立していればok • ※ただ、そもそも因果効果を考える場合にfull exchangeabilityが成立するようにLを選ぶ方が良いと思いま すし、meanだけ成立させる方が難しいかもしれません。 10
  7. 14.3 Structural nested mean models • 求めたいもの: =1 − =0

    = [=1 − =0|] • もしeffect-measure modificationがなければ、 =1 − =0 = 1 − =0 = 1 • Effect modificationがある場合には例えば、 − =0 = , = 1 + 2 • これらがstructural nested mean model. ※なぜ「nested」というのかは、time-varying treatmentを扱って初めて分かります、とのこと。 • 対称となる治療(ここではa=0) のアウトカムと差の期待値(mean)をaとLでモデル化 • 他の例:が”change in smoking intensity”などのcontinuous treatment variables − =0 = , = 1 + 2 2 + 3 + 4 2 • なお、g-estimationではcensoringに対応できないのでIP weightingでcensoringなし のpseudo-populationを作成したあとでg-estimationを使う必要がある。このセク ションではc=0を表記せずに進める。 11 =0 の部分をモデル化 しなくて良いので、 standardizationよりパラ メータが少ない =誤特定リスク小! βは線形
  8. 14.4 Rank preservation 12 • 続いて、structural nested mean modelを満 たす

    =0をモデル化するための部品 • Rank-preserving modelは非現実的だが簡 単でわかりやすい。 • − =0 をg-estiamtionで求めるとき、 実は = , さえ等しければ分布は 関係ない。
  9. 14.5 G-estimation • いよいよ本番!これまでの3セクションの内容を合体させるよ! • ゴール:structural nested mean model −

    =0 = 1 のパラメータ推定 • ここで、additive rank-preserving model − =0 = 1 を考える。このモデルにお いては、全員のindividual causal effectは1 で一定。 − =0 = 1 となる。 • − =0 = 1 ⇔ =0 = − 1 ⇒ =0 = − 1 ∵ • もし、 1 がわかればcounterfactual =0が計算できる! • 友人「 問題です!1 は† = −20, 0, 10のどれかだよ。どれでしょう!」 → =0の候補として、 † = − †を計算し、 = 1 =0, = 0 + 1 † + 2 のパラメータ推定を行う。 1 がゼロになる†が真の1 。 13 知りたいのは あくまで平均
  10. 14.5 G-estimation • 実際には候補を示してくれる友人はいない。 • それなら、全探索!Machine powerで殴ろう! • そもそも1 は因果効果であり、ありえそうな範囲は限定的。そこを細かく探していけ

    ば良い(例:-20~20, 0.01間隔) • NHEFSの例 14 → H(3.446)でほぼゼロ よって、禁煙が体重増加に与える 平均因果効果1 = 1 のg-推定量 ෢ 1 は3.4kg
  11. 14.5 G-estimation • g推定量の95%信頼区間: 1 = 0を検定して、有意水準0.05で棄却されない†の範囲 (censoringの補正にIP-weightingを用いている時はa robust variance

    estimatorを 用いる。その場合はconservativeな区間が得られる) • Bootstrap信頼区間でも問題ない。この場合はnon-conservative/narrower。 15 → 95%信頼区間:2.5~4.5
  12. 14.5 G-estimation • Non-rank-preserving modelを再考する。 • g-estimationでは、structural nested mean modelが正しく特定されていることを前提とし

    たが、それは個人因果効果が一定であること (つまり、additive rank-preserving modelが正 しいこと)を必要としない。 • 全てのLにおいて、 1 と=0の平均さえ等 しければOK • どういうこと? • = 1 =0, = 0 + 1 =0 + 2 • = 1 =0, = 0 + 1 † + 2 • を条件づけたと † の相関を見ている= 平均が等しければ分布は関係ない 16
  13. 14.6 Structural nested models with two or more parameters •

    Effect modificationがあるときは? • − =0 = , = 1 + 2 • g-estimationはconditional causal effectを求めるものであり、もしこの2 を落と してしまうと、biasにつながる • これは、effect modificationがある場合であってもmarginal structural mean model = 0 + 1 は誤特定されておらず、biasを生じないことと対照的。 • 対応するrank-preserving model: − =0 = 1 + 2 2つのパラメータ • = 1 † , = 0 + 3 • = 1 † , = 0 + 1 † + 2 † + 3 • 2次元空間での探索なので、より計算量が必要。でも実はclosed formでも解ける (Technical Point 14.2) • 極論はLのp個のstrata全てに対して: − =0 = 1 + σ =1 2, , 17 p+1個のパラメータを持つsaturated model
  14. 14.6 Structural nested models with two or more parameters •

    2 † の項が持つ役割の感覚的理解(Vが二値のとき) • 大事なこと:g-estimationはconditional exchangeabilityを確かめるものではなく、 conditional exchangeabilityが成立していることを前提とした手法(p178 コラム) • 1 † のついて1 = 0になることは、 を条件づけると平均してと † が相 関しない、ということを示しているに過ぎない。これはconditional exchangeability よりだいぶ緩く、条件を使い切ってはいない。 (つまり、 = 1 では、 † = 0, = 1 < † = 1, = 1 = 2 では、 † = 0, = 2 > † = 1, = 2 となっていて、全体では相関がない、ということかもしれない。) • ここで、2 † について2 = 0という条件を加えると、 = 0のときは2 の推定 に影響を及ぼさないので、 = 1のサンプルの中で 「を条件づけると平均してと † が相関しない」という条件を課すことができる。別の言い方をすると、で重 み付けをした上で「を条件づけると平均してと † が相関しない」という条件。 18
  15. 14.6 Structural nested models with two or more parameters •

    In practice, structural nested models with multiple parameters have rarely been used. • In fact, structural nested models of any type have rarely been used, partly because of the lack of user-friendly software and partly because the extension of these models to survival analysis requires some additional considerations (see Chapter 17). We now review two methods that are arguably the most commonly used approaches to adjust for confounding: outcome regression and propensity scores. • g-estimationの真の姿は、part IIIまで待ちましょう。 19
  16. F.P.14.1 Relation between marginal structural models and structural nested models

    • − =0| = 1 + 2 を、Semiparametric marginal structural mean model としてIP weightingでパラメータ推定することもできる。 • = • この重み付けをしたpseudo-population上でregressionする。(time-varying treatmentがなければ)semiparametric marginal structural mean modelとstructural nested mean modelは等価。 • 同じことを全てのLについての特別なケースで実行すると、 • − =0| = 1 + 2 • = = 1 • → faux semiparametric marginal structural model 20
  17. T.P. 14.1 multiplicative structural nested mean model • Yが正の値のみを取るとき、Multiplicative structural

    nested mean model • log = , =0 = , = 1 + 2 • 対応するrank-preserving model • † = −1 † − 2 † • として、解ける。確率が小さいときの、二値アウトカムもこれでOK。 • Yが二値のとき、structural nested logistic model • = 1 = , − =0 = 1 = , = 1 + 2 21
  18. F.P. 14.2 Sensitivity analysis for unmeasured confounding • いままでのg-estimationでは1 =

    0と推定されることを前提にしていた。 • Conditional exchangeabilityが成り立たず、unmeasured confoundingがあったら? • この場合、=0とがLを条件づけた上で相関してしまう→ 1 ≠ 0 • 想定されるassociationを例えば1 = 0.1として与えれば良い。 • 正確には、g-estimationはconditional exchangeabilityを必要とせず、1 で表される nonexchangeabilityの大きさがわかっていれば良い。 • Unmeasured confoundingがあると想定する場合は1 についての複数のシナリオを 用いて、g-estimationを繰り返すことでsensitivity analysisを実行できる。 22
  19. T. P. 14.2 G-estimation of structural mean models. • Structural

    nested model のパラメータを推定したい。 • − =0 = , ] = 1 • Estimating equation (censoringは省略) • σ † − = 0 • = σ − σ (− ) • としてclosed formで計算することができるそうです。 (申し訳ありませんが、このTechnical Pointはよく分かりませんでした。) 23
  20. Q&A • 疑問1:logistic modelに必要以上のパラメータを投入したらどうなるか • (p180) “Because the structural model

    has two parameters, 1 and 2, we also need to include two parameters in the IP weighted logistic model.” • 大事なこと:g-estimationはconditional exchangeabilityを確かめるものではなく、 conditional exchangeabilityが成立していることを前提とした手法(p178 コラム) • conditional exchangeabilityが成立する限りにおいて、Lの任意の部分集合V’につい て2′ † ’を追加しても、† = においては2′ = 0と推定されるはず。 • しかし、現実にはサンプル数の限界や誤差があるので全てのが同時にゼロになる とは限らず、困ってしまいそう。 24
  21. Q&A • 疑問2:logistic modelでeffect modificationを生じるVと違うV’を使ったら? • − =0 = ,

    = 1 + 2 • − =0 = 1 + 2 = † に対して、 • = 1 † , = 0 + 1 † + 2 † ′ + 3 • たいてい大丈夫だが、ダメなこともある。(自信なし。連立方程式の解不定と同様の 状況が生じうると思います。) 25
  22. Q&A • 疑問3:logistic modelで、 † の一次の項だけ でなく、二次や三次の項を追加したら? • (少なくともこの章の枠組みでは)ダメ。それは †

    に対して、meanだけではなく分布につい ての条件を課すことになる。=0|と=1|の平 均周りの分布が等しければおそらく問題なし。 • meanに注目して、meanについてのみ制御できる rank preserving modelを用いた。いくら†を調整 したところで、 † の分散は制御できず、 = 0にできない可能性がある。 • causal effectやcounterfactualの分布に興味があ る場合は、分布を制御できるmodelを用いて拡張 できるかもしれない(参考:Technical Point 14.2) 26