ID A Y Ya=1 Ya=0 1 120 120 140 薬を実際に飲んでいる⼈が「仮に」薬を飲む 介⼊を受けた時の⾎圧 = 実際の⾎圧?? つまり、Ya=1 = Y when A=1は成⽴する?? -> ある仮定が必要(後ほど詳しく) 「因果効果」とは︖ 23 個⼈レベルで考える 反事実(Counterfactual)モデルに基づく定義
Ø LはAとYの共通の原因(Common Cause) Ø AとYの間に統計的な関連が⽣じる Ø A<- L ->Yという裏⼝経路(Backdoor Path) Ø Lを条件づけることで裏⼝経路を閉じる Ø 「条件付け」とはLの値を揃えること Ø 回帰分析による”調整“とは条件付けのこと (詳しくは後半で) A Y L A Y L 46 DAGルール1︓ “共通の原因”による裏⼝経路
A︓ランダム割付された治療 C︓Loss-to-follow-up U︓抑うつレベル Y︓⾝体的健康状態 A Y C U Ø 離脱しなかったひとのみを分析(Cで条件付け) Ø 離脱しなかった&コントロール群の⼈は抑うつレベルが特別 低かった︖ Ø 介⼊群の⼈は少々抑うつレベルが⾼くても離脱しなかった︖ 49 選択バイアスの例︓追跡の失敗
A Y C U (Hernan et al 2004) (edX Free Online Course by Hernan) 50 DAGルール2︓“共通の効果”の条件付けによる裏⼝経路 1. 追跡の失敗(Loss-to-follow-up) 2. 競合リスク(Competing Risk) 3. サンプリング⽅法 4. ⽋測データ(Missing Data) 5. ⾃⼰選択(Self-selection) બόΠΞε͕ੜ͡ΔγφϦΦ
A Y U1 L U2 1. Lは曝露因⼦Aと関連 2. LはアウトカムYと関連 3. LはAとYの中間因⼦ではない -ަབྷҼࢠʁௐ͖͢ʁ A Y U1 L U2 Ø LはCollider Ø 調整すべきではない Ø M-bias Ø 統計テクニックでは判断で きない 55 DAGの利点︓理論的根拠に基づいた分析⽅法の選択
1. Mを調整しないでAとYの関連を⾒る 2. Mを回帰モデルに加える 3. AとYの関連の推定値が変わるか確認 .ʹΑΔഔհޮՌΛΓ͍ͨ M Y A U M Y A U Ø MはCollider Ø 単純に調整してしまうとA->M<-U->Y の関連を導⼊ Ø 推定値の変化はCollider Stratificationに よるものかも︖ 56 DAGの利点︓理論的根拠に基づいた分析⽅法の選択
86 傾向スコアマッチング Ø 傾向スコア︓Pr[A=1|L] Ø マッチング後はLの分布が同じになる Ø L->Aの⽮印がなくなる(vs 条件付け) Ø L層でのConditional exchangeabilityを仮定 Ø マッチング後のサンプルではA=0群とA=1 群をシンプルに⽐較 A Y L A Y L
87 逆確率重み付け(IPTW) Ø 傾向スコア(っぽいもの)︓Pr[A=a|L] Ø Inverse Probability Weighting Ø 重み付けによるPseudo-populationの作成 Ø L->Aの⽮印がなくなる(vs 条件付け) Ø L層でのConditional exchangeabilityを仮定 Ø Pseudo-population内ではYとAの関連をシ ンプルに⽐較(Marginal Structural Model) A Y L A Y L