G-estimation and Structural nested mean model(Causal inference: What if, Chapter 14)

東京大学医学系研究科博士課程三谷知広 (@m_tomo_) 1 Chapter 14 G-ESTIMATION AND STRUCTURAL NESTED
MEAN MODEL

Chapter 14 G-ESTIMATION OF STRUCTURAL NESTED MODELS • g-methods •
IP weighting • standardization • g-estimation • この3つは時間依存性の介入などに対するgeneralizedな治療効果を算出する手法。どれも前提とするモデルの仮定は異なる。 • g-methodsをPart IIの時間依存でない治療に適用するのはoverkill • でも、Part IIIで必要になるので、まずは単純な場面で解説しておく • g-estimationは、structural nested model（後述）のパラメータを推定する手法。 • g-estimationは以下のパーツから構成される。 • Conditional exchangeability （14.2) • Structural nested models (14.3) • Rank-preserving models (14.4) 2

14.1 The causal question revisited • 12章、13章：25-74歳の喫煙者1566人について、喫煙中止Aが体重増加Yに与える因果効果を推定した。 • ただし、Conditional
exchangeability on the L vairablesを仮定：性別、年齢、人種、教育、喫煙の程度、日々の生活強度、運動習慣、体重 • Average causal effect on the difference scale： =1,=0 − =0,=0 • 場合によっては一部の集団についてのcausal effectを考えることもできる例： =1,=0 − =0,=0 =1,=0 = 45 − =0,=0 = 45 =1,=0 − =0,=0 • Product termを含んだmarginal structural models （12章）を用いたり、 standardizationを特定のsubsetのみに適用（13章）したりすることで推定できる。 • Lのそれぞれの層における因果効果（ =1,=0 − =0,=0 ）の推定は？ • 12.5章ではLの全てのproduct termを含んだfaux marginal structural modelを紹介 • この章では、g-estimationで =1,=0 − =0,=0 を推定する 3

14.1 The causal question revisited 4 • Faux marginal structural
modelの復習 • IP weightingせずに、linear regression modelからパラメータ推定できる

14.1 The causal question revisited 14章のゴール (g-estimationを用いて）Lで条件づけたときの平均因果効果を求める =1,=0 − =0,=0
※ average causal effectではないことに注意。 5

• この節では、conditional exchangeabilityを満たすための（必要）条件を検討する。 • Conditional exchangeability: ⊥ | ℎ =
1 = 0 • まず、=0について考える。 Conditional exchangeabilityが成立しているとき、Lに加えて=0がわかってもA=0かA=1を予測する材料にはならない。これは、 =0| = 0, の分布と、 =0| = 1, の分布が等しく、全ての =0において、 Pr = 0 =0, = Pr[ = 0|]になるから。 • =0 ⊥ | ( ∈ 0,1 ) • ⇔ Pr =0 = 0, = Pr =1 = 1, • ⇔ Pr = 0 =0, = Pr = 0 14.2 Exchangeability revisited 6

14.2 Exchangeability revisited • ⇒ =0を知っていて、真のモデルが以下のとき、 = 1 = 0
+ 2 = 1 =0, = 0 + 1 =0 + 2 のパラメータを推定すると、1 はどうなるか？ → 1 = 0 • ここで「逆」の発想。 1 = 0になるなら、正しい=0なのではないか？ ※「逆」なので必ずしも成立しません。しかし、がパラメータで表現され、そのパラメータの範囲内で1 = 0になるが唯一であれば、それが正しいではあるはずです。 7

Technical Point 2.1 mean exchangeability再訪 8 Full exchangeabilityは成立しないが、exchangeabilityは成立する例。下剋上させる治療？

Technical Point 2.1 mean exchangeability再訪 • Exchangeabilityを満たすがfull exchangeabilityを満たさないとき：個々のY^(a=0)、 Y^(a=1)はAと独立だが、joint distributionは独立でない。
9

Technical Point 2.1 mean exchangeability再訪 • 少なくとも（g-estimationを含む）ここまでに出てきた手法においては、分布は不問でmean exchangeabilityが成立していればok •
当然、full exchangeability (joint exchangeability)も必須ではない • =0 = 1, = [=1| = 0, ]が成立していればok • ※ただ、そもそも因果効果を考える場合にfull exchangeabilityが成立するようにLを選ぶ方が良いと思いますし、meanだけ成立させる方が難しいかもしれません。 10

14.3 Structural nested mean models • 求めたいもの： =1 − =0
= [=1 − =0|] • もしeffect-measure modificationがなければ、 =1 − =0 = 1 − =0 = 1 • Effect modificationがある場合には例えば、 − =0 = , = 1 + 2 • これらがstructural nested mean model. ※なぜ「nested」というのかは、time-varying treatmentを扱って初めて分かります、とのこと。 • 対称となる治療（ここではa=0) のアウトカムと差の期待値(mean)をaとLでモデル化 • 他の例：が”change in smoking intensity”などのcontinuous treatment variables − =0 = , = 1 + 2 2 + 3 + 4 2 • なお、g-estimationではcensoringに対応できないのでIP weightingでcensoringなしのpseudo-populationを作成したあとでg-estimationを使う必要がある。このセクションではc=0を表記せずに進める。 11 =0 の部分をモデル化しなくて良いので、 standardizationよりパラメータが少ない＝誤特定リスク小！ βは線形

14.4 Rank preservation 12 • 続いて、structural nested mean modelを満たす
=0をモデル化するための部品 • Rank-preserving modelは非現実的だが簡単でわかりやすい。 • − =0 をg-estiamtionで求めるとき、実は = , さえ等しければ分布は関係ない。

14.5 G-estimation • いよいよ本番！これまでの3セクションの内容を合体させるよ！ • ゴール：structural nested mean model −
=0 = 1 のパラメータ推定 • ここで、additive rank-preserving model − =0 = 1 を考える。このモデルにおいては、全員のindividual causal effectは1 で一定。 − =0 = 1 となる。 • − =0 = 1 ⇔ =0 = − 1 ⇒ =0 = − 1 ∵ • もし、 1 がわかればcounterfactual =0が計算できる！ • 友人「問題です！1 は† = −20, 0, 10のどれかだよ。どれでしょう！」 → =0の候補として、 † = − †を計算し、 = 1 =0, = 0 + 1 † + 2 のパラメータ推定を行う。 1 がゼロになる†が真の1 。 13 知りたいのはあくまで平均

14.5 G-estimation • 実際には候補を示してくれる友人はいない。 • それなら、全探索！Machine powerで殴ろう！ • そもそも1 は因果効果であり、ありえそうな範囲は限定的。そこを細かく探していけ
ば良い（例：-20～20, 0.01間隔） • NHEFSの例 14 → H(3.446)でほぼゼロよって、禁煙が体重増加に与える平均因果効果1 = 1 のg-推定量 ෢ 1 は3.4kg

14.5 G-estimation • g推定量の95%信頼区間： 1 = 0を検定して、有意水準0.05で棄却されない†の範囲（censoringの補正にIP-weightingを用いている時はa robust variance
estimatorを用いる。その場合はconservativeな区間が得られる） • Bootstrap信頼区間でも問題ない。この場合はnon-conservative/narrower。 15 → 95%信頼区間：2.5～4.5

14.5 G-estimation • Non-rank-preserving modelを再考する。 • g-estimationでは、structural nested mean modelが正しく特定されていることを前提とし
たが、それは個人因果効果が一定であること（つまり、additive rank-preserving modelが正しいこと）を必要としない。 • 全てのLにおいて、 1 と=0の平均さえ等しければOK • どういうこと？ • = 1 =0, = 0 + 1 =0 + 2 • = 1 =0, = 0 + 1 † + 2 • を条件づけたと † の相関を見ている＝平均が等しければ分布は関係ない 16

14.6 Structural nested models with two or more parameters •
Effect modificationがあるときは？ • − =0 = , = 1 + 2 • g-estimationはconditional causal effectを求めるものであり、もしこの2 を落としてしまうと、biasにつながる • これは、effect modificationがある場合であってもmarginal structural mean model = 0 + 1 は誤特定されておらず、biasを生じないことと対照的。 • 対応するrank-preserving model： − =0 = 1 + 2 2つのパラメータ • = 1 † , = 0 + 3 • = 1 † , = 0 + 1 † + 2 † + 3 • 2次元空間での探索なので、より計算量が必要。でも実はclosed formでも解ける（Technical Point 14.2) • 極論はLのp個のstrata全てに対して： − =0 = 1 + σ =1 2, , 17 p+1個のパラメータを持つsaturated model

2 † の項が持つ役割の感覚的理解（Vが二値のとき） • 大事なこと：g-estimationはconditional exchangeabilityを確かめるものではなく、 conditional exchangeabilityが成立していることを前提とした手法(p178 コラム) • 1 † のついて1 = 0になることは、を条件づけると平均してと † が相関しない、ということを示しているに過ぎない。これはconditional exchangeability よりだいぶ緩く、条件を使い切ってはいない。（つまり、 = 1 では、 † = 0, = 1 < † = 1, = 1 = 2 では、 † = 0, = 2 > † = 1, = 2 となっていて、全体では相関がない、ということかもしれない。） • ここで、2 † について2 = 0という条件を加えると、 = 0のときは2 の推定に影響を及ぼさないので、 = 1のサンプルの中で「を条件づけると平均してと † が相関しない」という条件を課すことができる。別の言い方をすると、で重み付けをした上で「を条件づけると平均してと † が相関しない」という条件。 18

In practice, structural nested models with multiple parameters have rarely been used. • In fact, structural nested models of any type have rarely been used, partly because of the lack of user-friendly software and partly because the extension of these models to survival analysis requires some additional considerations (see Chapter 17). We now review two methods that are arguably the most commonly used approaches to adjust for confounding: outcome regression and propensity scores. • g-estimationの真の姿は、part IIIまで待ちましょう。 19

F.P.14.1 Relation between marginal structural models and structural nested models
• − =0| = 1 + 2 を、Semiparametric marginal structural mean model としてIP weightingでパラメータ推定することもできる。 • = • この重み付けをしたpseudo-population上でregressionする。(time-varying treatmentがなければ）semiparametric marginal structural mean modelとstructural nested mean modelは等価。 • 同じことを全てのLについての特別なケースで実行すると、 • − =0| = 1 + 2 • = = 1 • → faux semiparametric marginal structural model 20

T.P. 14.1 multiplicative structural nested mean model • Yが正の値のみを取るとき、Multiplicative structural
nested mean model • log = , =0 = , = 1 + 2 • 対応するrank-preserving model • † = −1 † − 2 † • として、解ける。確率が小さいときの、二値アウトカムもこれでOK。 • Yが二値のとき、structural nested logistic model • = 1 = , − =0 = 1 = , = 1 + 2 21

F.P. 14.2 Sensitivity analysis for unmeasured confounding • いままでのg-estimationでは1 =
0と推定されることを前提にしていた。 • Conditional exchangeabilityが成り立たず、unmeasured confoundingがあったら？ • この場合、=0とがLを条件づけた上で相関してしまう→ 1 ≠ 0 • 想定されるassociationを例えば1 = 0.1として与えれば良い。 • 正確には、g-estimationはconditional exchangeabilityを必要とせず、1 で表される nonexchangeabilityの大きさがわかっていれば良い。 • Unmeasured confoundingがあると想定する場合は1 についての複数のシナリオを用いて、g-estimationを繰り返すことでsensitivity analysisを実行できる。 22

T. P. 14.2 G-estimation of structural mean models. • Structural
nested model のパラメータを推定したい。 • − =0 = , ] = 1 • Estimating equation (censoringは省略) • σ † − = 0 • = σ − σ (− ) • としてclosed formで計算することができるそうです。（申し訳ありませんが、このTechnical Pointはよく分かりませんでした。） 23

Q&A • 疑問1：logistic modelに必要以上のパラメータを投入したらどうなるか • (p180) “Because the structural model
has two parameters, 1 and 2, we also need to include two parameters in the IP weighted logistic model.” • 大事なこと：g-estimationはconditional exchangeabilityを確かめるものではなく、 conditional exchangeabilityが成立していることを前提とした手法(p178 コラム) • conditional exchangeabilityが成立する限りにおいて、Lの任意の部分集合V’について2′ † ’を追加しても、† = においては2′ = 0と推定されるはず。 • しかし、現実にはサンプル数の限界や誤差があるので全てのが同時にゼロになるとは限らず、困ってしまいそう。 24

Q&A • 疑問2：logistic modelでeffect modificationを生じるVと違うV’を使ったら？ • − =0 = ,
= 1 + 2 • − =0 = 1 + 2 = † に対して、 • = 1 † , = 0 + 1 † + 2 † ′ + 3 • たいてい大丈夫だが、ダメなこともある。（自信なし。連立方程式の解不定と同様の状況が生じうると思います。） 25

Q&A • 疑問3：logistic modelで、 † の一次の項だけでなく、二次や三次の項を追加したら？ • （少なくともこの章の枠組みでは）ダメ。それは †
に対して、meanだけではなく分布についての条件を課すことになる。=0|と=1|の平均周りの分布が等しければおそらく問題なし。 • meanに注目して、meanについてのみ制御できる rank preserving modelを用いた。いくら†を調整したところで、 † の分散は制御できず、 = 0にできない可能性がある。 • causal effectやcounterfactualの分布に興味がある場合は、分布を制御できるmodelを用いて拡張できるかもしれない（参考：Technical Point 14.2) 26

G-estimation and Structural nested mean model(C...

G-estimation and Structural nested mean model(Causal inference: What if, Chapter 14)

Shuntaro Sato

More Decks by Shuntaro Sato

Other Decks in Science

Featured

Transcript

東京大学医学系研究科博士課程三谷知広 (@m_tomo_) 1 Chapter 14 G-ESTIMATION AND STRUCTURAL NESTED

Chapter 14 G-ESTIMATION OF STRUCTURAL NESTED MODELS • g-methods •

14.1 The causal question revisited • 12章、13章：25-74歳の喫煙者1566人について、喫煙中止Aが体重増加Yに与える因果効果を推定した。 • ただし、Conditional

14.1 The causal question revisited 4 • Faux marginal structural

14.1 The causal question revisited 14章のゴール (g-estimationを用いて）Lで条件づけたときの平均因果効果を求める =1,=0 − =0,=0

• この節では、conditional exchangeabilityを満たすための（必要）条件を検討する。 • Conditional exchangeability: ⊥ | ℎ =

14.2 Exchangeability revisited • ⇒ =0を知っていて、真のモデルが以下のとき、 = 1 = 0

Technical Point 2.1 mean exchangeability再訪 8 Full exchangeabilityは成立しないが、exchangeabilityは成立する例。下剋上させる治療？

Technical Point 2.1 mean exchangeability再訪 • Exchangeabilityを満たすがfull exchangeabilityを満たさないとき：個々のY^(a=0)、 Y^(a=1)はAと独立だが、joint distributionは独立でない。

Technical Point 2.1 mean exchangeability再訪 • 少なくとも（g-estimationを含む）ここまでに出てきた手法においては、分布は不問でmean exchangeabilityが成立していればok •

14.3 Structural nested mean models • 求めたいもの： =1 − =0

14.4 Rank preservation 12 • 続いて、structural nested mean modelを満たす

14.5 G-estimation • いよいよ本番！これまでの3セクションの内容を合体させるよ！ • ゴール：structural nested mean model −

14.5 G-estimation • 実際には候補を示してくれる友人はいない。 • それなら、全探索！Machine powerで殴ろう！ • そもそも1 は因果効果であり、ありえそうな範囲は限定的。そこを細かく探していけ

14.5 G-estimation • g推定量の95%信頼区間： 1 = 0を検定して、有意水準0.05で棄却されない†の範囲（censoringの補正にIP-weightingを用いている時はa robust variance

14.5 G-estimation • Non-rank-preserving modelを再考する。 • g-estimationでは、structural nested mean modelが正しく特定されていることを前提とし

14.6 Structural nested models with two or more parameters •

14.6 Structural nested models with two or more parameters •

14.6 Structural nested models with two or more parameters •

F.P.14.1 Relation between marginal structural models and structural nested models

T.P. 14.1 multiplicative structural nested mean model • Yが正の値のみを取るとき、Multiplicative structural

F.P. 14.2 Sensitivity analysis for unmeasured confounding • いままでのg-estimationでは1 =

T. P. 14.2 G-estimation of structural mean models. • Structural

Q&A • 疑問1：logistic modelに必要以上のパラメータを投入したらどうなるか • (p180) “Because the structural model

Q&A • 疑問2：logistic modelでeffect modificationを生じるVと違うV’を使ったら？ • − =0 = ,

Q&A • 疑問3：logistic modelで、 † の一次の項だけでなく、二次や三次の項を追加したら？ • （少なくともこの章の枠組みでは）ダメ。それは †