Slide 1

Slide 1 text

NIID Spring seminer 2024 媒介分析と疫学 国⽴感染症研究所 第12室⻑ ⽶岡 ⼤輔

Slide 2

Slide 2 text

⽬次 1. 因果推論の基礎 • 因果と予測 • 統計的因果推論の枠組み • Pearl流とRubin流 2. Causal mediation analysis • 直接効果と間接効果 • Parametric inferenceとNon/Semi-parametric inference 2/24

Slide 3

Slide 3 text

因果と予測 研究⽬的に沿った統計⼿法やってる? 2018年に6領域のTop journalから出版された論⽂ ⽬的が予測なのに因果推論を⽬的とした解析してない?逆もしてない? 結構してるね! 3/24 Ramspek CL, et al. Prediction or causality? A scoping review of their conflation within current observational research. Eur J Epidemiol. 2021;36(9):889-898.

Slide 4

Slide 4 text

混合しちゃうタイプ⼀覧 4/24

Slide 5

Slide 5 text

統計的因果推論 ある事柄(原因)が、⽣じる効果(結果)にどの程度影響を及ぼして いる 統計データを通して定量的に評価する⽅法論を提供する • 具体的にはどうすんの? 「反事実モデルの構築」 「もし、〜だったら、〜になっていただろう」(反実仮想) • 操作なくして因果なし ただし、処置が属性変数(e.g., 性別)のような抽象的なものである場合、 何が操作されているのかが分かりづらい ex. もし、あの⼥性が男だったら髪が短いだろう 反事実である「⼥でない」という処置が不明確であり、因果推論困難 → 何が操作できるのか(処置変数)を明確にすることが重要 5/24 岩崎 , 2015

Slide 6

Slide 6 text

Rubin流とPearl流の因果推論 Rubin流の因果推論 (潜在反応モデル) 潜在的結果変数の枠組み Pearl流の因果推論(構造的因果モデル) Rubin流とほぼ同じだが、DAGと呼ばれるグラフィカルモデ ルを⽤いる cf. グレンジャー因果 2つの時系列データA, Bについて、現在のBを予測するのに過去 のAのデータが役⽴つならば、AはBに対してグレンジャー因果 を持つと考える。 場合に合わせて使い分けるのがいいと思います。 6/24

Slide 7

Slide 7 text

SUTVA (Stable Unit Treatment Value Assumption)条件 潜在的な反応を定義するにあたっての重要な条件 • 条件1 No Interference between Subjects: 相互⼲渉がない • 条件2 No Multiple Versions of Treatment: 個体に対する隠れた処置がない 個体Aに対する処置が個体Bにも影響するとなると条件1に違反 例)個体Aへの感染病の予防処置が個体Bの感染リスクを下げるのであれば、相 互⼲渉があることになる。 個体によって処置の⽅法が異なると、条件2に違反 例)学⽣によって補習授業の教材や指導法が異なる 条件1,2より⼀致性の条件が導かれる。 A = a ならば,Y(a) = Y が成り⽴つ 処理 a を受けた個体の反応変数Yの値は、潜在的な反応変数Y(a)に⼀致 7/24

Slide 8

Slide 8 text

超ざっくりとDAGと共変量の選び⽅ DAG: Directed asyclic graph (有向⾮巡回グラフ) 要は⽮印付きでループがないグラフ 8/24 • とにかくDAGを書くんじゃよ • そして、バックドア基準が満たされてい ることを確認するんじゃよ と⾔ったかどうかは知りません。

Slide 9

Slide 9 text

バックドアを閉じよ バックドアパス =「処理Xと結果Yの上流側にある両者に影響を与える流れ」 9/24 環境研、林先生のスライドより

Slide 10

Slide 10 text

バックドアパスの何が問題?→じゃあどうすんの? 10/24 環境研、林先生のスライドより

Slide 11

Slide 11 text

ColiderとIntermidiaterは調整すんな 11/24 Colider:合流点は調整するな Intermidiator:中間変数は調整するな 環境研、林先生のスライドより

Slide 12

Slide 12 text

DAGまとめ 12/24 まぁ3変数くらいまでなら頑張ればいけますよね それ以上になるとまぁきつい (ソフト使いましょう) はい、Dagnity〜 (https://dagitty.net/dags.html#)

Slide 13

Slide 13 text

Causal mediation • 今さっきIntermidiatorは⼊れるな⾔うたやろ • Mediationのとき、やっぱ⼊れます。 13/24 処理変数A, 中間変数M, 反応変数YのDAG

Slide 14

Slide 14 text

わりと上級な疫学⼿法: Causal mediation analysis 疫学研究にて、mediatorを介した影響を考える場⾯を⼤きく分けると 1. メカニズムを解明したいとき 2. mediatorへの介⼊を⾏いたいとき (介⼊の難しい曝露を扱うとき) 14/24 井上ら、2021

Slide 15

Slide 15 text

直接効果と間接効果 直接効果=A → Y の因果関係の強さ 間接効果=A → M → Yの因果関係の強さ 総合効果=直接効果 + 間接効果 当然、交絡も調整する必要あり (曝露―アウトカム、曝露―中間因⼦、中間因⼦―アウトカムの3経路) それぞれの経路に関する交絡を考えようね 15/24 RCTでも中間因⼦はランダム割付されてない ので、きちんと交絡を考えようね

Slide 16

Slide 16 text

潜在反応モデル 数式はあまり使わないようにとのことですが、これだけは許して! Y(a):処理 A = a を受けたときに観測されるであろう反応変数 M(a):処理 A = a を受けたときに観測されるであろう中間変数 Y(a, m):A = a , M = m を受けたときに観測されるであろう反応変数 実際に観測されるのは1つだけで, それ以外は観測されない 反事実モデル(counterfactual model) 16/24

Slide 17

Slide 17 text

再掲: SUTVA (Stable Unit Treatment Value Assumption)条件 潜在的な反応を定義するにあたっての重要な条件 • 条件1 No Interference between Subjects: 相互⼲渉がない • 条件2 No Multiple Versions of Treatment: 個体に対する隠れた処置がない 個体Aに対する処置が個体Bにも影響するとなると条件1に違反 例)個体Aへの感染病の予防処置が個体Bの感染リスクを下げるのであれば、相 互⼲渉があることになる。 個体によって処置の⽅法が異なると、条件2に違反 例)学⽣によって補習授業の教材や指導法が異なる 条件1,2より⼀致性の条件が導かれる。 A = a ならば,Y(a) = Y が成り⽴つ 処理 a を受けた個体の反応変数Yの値は、潜在的な反応変数Y(a)に⼀致 17/24

Slide 18

Slide 18 text

効果の定義: a*を基準としてaを⾒たい 総合効果 (total effect) TE(a, a*) = Y(a) − Y(a*) = Y(a, M(a)) ‒ Y(a*, M(a*)) 直接効果 ・⾃然な直接効果/純粋な直接効果 (natural direct effect / pure direct effect) PDE(a, a*) = Y(a, M(a*)) − Y(a*, M(a*)) ・総合直接効果(total direct effect) TDE(a, a*) = Y(a, M(a)) − Y(a*, M(a)) 18/24 ⾔葉でいうと:PDEでM(a)をM(a*)とした場合 ⾔葉でいうと:処置aとa*を⽐較ときの反応変数の差 ⾔葉でいうと:処理が a* であったとするときに⾃ずと⽣じるであろう状態を維持したときの 処理 a と処理 a* とを⽐較したときの効果

Slide 19

Slide 19 text

Cont. 効果の定義: a*を基準としてaを⾒たい 制御された直接効果(controlled direct effect) CDE(a, a*; m*) = Y(a, m*) ‒ Y(a*, m*) 間接効果 ・⾃然な間接効果/総合間接効果 (natural indirect effect / total indirect effect) TIE(a, a*) = Y(a, M(a)) − Y(a, M(a*)) ・純粋な間接効果 (pure indirect effect) PIE(a, a*) = Y(a*, M(a)) − Y(a*, M(a*)) 19/24 ⾔葉でいうと:処理レベルをA = aとしたときに, 処理がa*であったときに⾃ずと⽣じたで あろう中間変数の状態 vs. 処理がaであったときに⾃ずと⽣じたであろう中間変数の状態 ⾔葉でいうと:TIEでaをa*とした場合 ⾔葉でいうと:何らかの介⼊により中間変数を m* に制御(固定)したときに, 処理を a* か ら処理 a に変化させたときの効果

Slide 20

Slide 20 text

Cauthion! PDEやらPIEやらはわかったけど、CDEだけ⽑⾊が違うくない? • (Causal meditation analysis) PDEとかは潜在反応(M(a)とかM(a*)とか)で定義さ れてた • CDEだけM=mと固定(要は介⼊してその値に持っていく的な)で定義している • Mediatorに介⼊することで、曝露のアウトカムへ の影響をどれだけ除去できるかを評価可能 Causal meditation analysisは、AからYへの可能な因果経路を特定するた めに⽤いられるが、例えば、Yに対する(Aの関数としての)Mの因果効果 がどのように変化するかを理解したい場合には、CDEが重要であろう。 ⾔い換えると、前者はMがAとYの因果関係を媒介するかどうかを調べる のに対し、後者はAがMのYに対する因果効果を緩和するかどうかを調べ る(Baron and Kenny, 1986) 20/24

Slide 21

Slide 21 text

総合効果の分解 • TE (総合効果) = PDE (純粋な直接効果) + TIE (統合間接効果) = TDE (総合直接効果) + PIE (純粋な間接効果) = CDE (制御された直接効果) + + PAI (⽣物学的交互作⽤に起因する効果) + PIE (純粋な間接効果) ⽣物学的交互作⽤ (biologic interaction) 細かい話は今回はなし。気になるならVanderWeele (2013) CDEは曝露と中間因⼦に交互作⽤がない場合に PDE と⼀致 21/24 VanderWeele (2013)

Slide 22

Slide 22 text

因果効果を識別するための⼗分条件 • ∀a, m に対して Y(a, m) ⫫ A | C 処理変数と反応変数との間に未測定の交絡因⼦がないこと • ∀a, m に対して Y(a, m) ⫫ M |{A, C} 中間変数と処理変数との間に未測定の交絡因⼦がないこと • ∀a に対して M(a) ⫫ A | C 処理変数と中間変数との間に未測定の交絡因⼦がないこと • ∀a, a*, m に対して Y(a, m) ⫫ M(a*) | C 中間変数と反応変数と交絡をおこす処理変数が存在しないこと 22/24 Pearl (2001) VanderWeele and Vansteelandt (2009) ⽥栗 (2014)

Slide 23

Slide 23 text

ごたくはいいから実際どうすんのか説明してよ Baron & Kenny method (1986) (Imai et al. (2009)による拡張は⾃分でみてね) Step1 (処理Aと反応Yのモデル): Y = α+ cA + e1 でc(総合効果) が有意か調べる Step2 (MとAのモデル): M = β + aA + e2 でa が有意か調べる Step3 (MとAのモデル): Y = γ +cʼA+ bM + e3 でb が有意か調べる このときPIEはcʼ(a-a*)、PDEはab(a-a*)で与えられる。 PDEが有意かどうかの検定: Sobel testなど 標準誤差はデルタ法 or ブートストラップ法(VanderWeele and Vansteelandt(2009)) 23/24 c’ a b もしAとMに交互作⽤があると、こう簡単にはいかない これは特殊な例で、潜在反応アプローチとBaron & Kenney法が⼀致する場合を紹介

Slide 24

Slide 24 text

Advancedな⽅法 24/24 より⼀般への拡張 YやMが2値変数のときは条件付き期待値をlogitとかで代替しておく PDE = TIE = CDE(m) = 細かいことはいいんだよっていう⼈ Rパッケージ: mediation (Tingley et al. (2019))、medflex(Steen et al. (2019)) Stataコマンド: Med4way (Discacciati et al.(2019))