Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Selection bias(Causal inference: What if, Chapt...

Shuntaro Sato
November 18, 2020
4.3k

Selection bias(Causal inference: What if, Chapter 8)

Keywords: 因果推論, Selection bias(選択バイアス), Censoring(打ち切り), Confounding(交絡)

Shuntaro Sato

November 18, 2020
Tweet

More Decks by Shuntaro Sato

Transcript

  1. 章の構成 8.1 The structure of selection bias structural approachでのselection biasの定義

    8.2 Examples of selection bias selection biasが起きる状況の例⽰ 8.3 Selection bias and confounding confoundingと分ける意味 8.4 Selection bias and censoring censoringを別のtreatmentとして捉える 8.5 How to adjust for selection bias IPWによるselection biasの補正 8.6 Selection without bias biasの起こらない場合
  2. 単純な例 ´ Selection bias = colliderを条件づけることでA とYのパスが開き生じたassociation ´ A: 葉酸摂取,

    Y: 心奇形, C: 胎児死亡 ´ A→Yはあってもなくても発生する(bias under the null) ´ Cの子孫ノードSを固定してもパスが開き selection biasが発生する
  3. Selection biasが起きる状 況 Differential loss to follow-up, Informative censoring: 実験・観察途中での脱落

    Missing data bias, non-response bias: データの⽋測・アンケートへの無回答 Healthy worker bias: 働いている⼈は⽐較的健康 Self-selection bias, volunteer bias: ⾃主的に参加する背景因⼦ Selection affected by treatment received before study entry: 研究開始前の処置が選択に影響を及ぼす
  4. Traditional terminology ´ “selection bias”という⾔葉は、(structuralな)confoundingとselection biasの両⽅の意味 で使われてきた ´ (structural) confoundingとselection

    biasはどちらも選択の結果⽣まれうるから ´ 処置群への割付の際に選択が起こるconfounding ´ 分析へ含める際に選択が起こるselection bias ´ 重要なのは、structural biasが2種類あるということ︕
  5. confoundingとselection biasを 区別できない例 ´ Figure 8.7では、Cの条件付けによって selection biasが起きている。 ´ 分析者からはUが分からない。

    ´ Lを条件づければA←U→C←L→Yのpathは閉 じるので、分析者からはLによるconfounding のようにも⾒える ´ confoundingとselection biasを区別できなくて もA→Yを調べるのに⽀障がない場合もある。
  6. Structural approachを使 うメリット ´ 分析⽅法を決定する判断材料になる。 Ex. Stratificationによるconfoundingの調整が selection biasを⽣む場合(Part III)

    ´ データ収集の際に必要な変数の判断材料になる。 Ex. Figure 8.3ではLを条件づければ blockできる ので、Lに該当しそうな変数のデータを取って おく。 ´ ある研究では共変量Lを調整することに意味が あって、別の研究では調整する必要がない理由 がわかる。 Ex. Cでselectionが発⽣していないときにYとCの common causeを条件付ける意味がない ´ Causal diagramを⽤いて円滑なコミュニケーショ ンを⾏える。
  7. Censoringをもう⼀つの treatmentとしてみる ´ 本当に比べたいのはPr[!"# = 1]と Pr[!"$ = 1] ´

    Cをもう1つのtreatmentとして捉えると、 Pr[!"#,&"$ = 1]と Pr[!"$,&"$ = 1]を比べる ことになる ´ 大抵の場合はC→Yはないと考えられるので 、treatment Cに対するconfoundingを調整して しまえばA→Yを考えることができる ´ Cについてexchangeability, positivity, consistencyが成り立つ必要がある ´ Cのconfoundingの調整方法を8.5で扱う
  8. IPWで調整できる条件 ´ Exchangeability: AとLが同じならばCによらずYの平均が等しくなければならない。 YとCの全てのbackdoor pathを閉じるのに⼗分な変数がLに含まれている必要がある が確かめようがないため、この条件はUntestable ´ Positivity: L内の全ての変数について少なくともuncensoredな場合にpositivityが成り

    ⽴つ。Censoredについては成り⽴たなくても良い。 ´ Consistency: Censoringをcompeting eventで定義してはならない。例えば、deathを censoringの1形態としてしまうと、deathをもたらすあらゆる変数を除去しなけれ ばならない。
  9. Stratification ´ 8.3, 8.5ではLを条件づけることによってAとY のCを通したpathを閉じることができる。 ´ 8.4, 8.6でも同様にCを介したpathは閉じられ るが、今度はLを介したpathが開いてしまい selection

    biasが生じてしまう。 ´ IPWはLで条件づけたeffectを計算するわけで はないので8.4, 8.6についても問題なく適用で きる。 ´ このようにstratificationが使えない状況(time- varying treatmentを考える場合)をPart IIIにて 詳しく扱う。
  10. Conditionally independenceが保 たれる場合 ´ Y=1で条件づけたときAとEがassociatedにな っても、Y=0ではindependentのままであるこ とはある。 ´ 例えばAとEが異なる機序で死Yを引き起こす 場合、Aが引き起こすY_AとEが引き起こす

    Y_EはYと決定論的に結ばれる。 ´ Y=0で条件づけるとA→Y←Eが開くが、Y_A とY_Eが自動的に0に条件づけられpathが閉じ るのでAとEは独立のままである。 ´ Y=1で条件づけるとY_AとY_Eは一意に定ま らないので開いたpathが閉じずselection bias が起こる。
  11. Fine Point 8.1 Selection bias in case-control studies ´ 曝露Aと疾患Yの関係を調べるcase-control

    studyではY=1のcase群とY=0のcontrol群 を作り、過去の曝露Aの有無を調べる。 ´ 研究したい集団から分析対象に選ばれるかどうか(C)は疾患Yの影響を受ける。疾 患Yの患者はYの患者でない⼈より分析対象に選ばれる可能性は⾼い。 ´ 曝露AもCに影響を与えうる。この時、分析対象を選ぶこと(C=1に固定すること) はAとYのcommon effectに対する条件付けとなりselection biasが⽣じる。 ´ Case-control studyは定義上selection biasの影響を受けやすい研究デザインであると いえる。
  12. Fine Point 8.2 The strength and direction of selection bias

    ´ “or” mechanisum: AとEが共にYのcauseであるとき、A=1 or E=1でY=1となるとする と、Y=1としたときAとEは負の相関になる。Y=1かつA=0ならE=1となるし、Y=1 かつA=1ならE=0となる。 ´ “and” mechanism: A=1 and E=1でY=1となるとすると、Y=1としたときAとEは正の 相関になる。 ´ selection biasはtreatmentとoutcomeがcolliderと強く相関するときに強くなる
  13. Technical Point 8.1 The built-in selection bias of hazard ratio

    ´ Aを心臓移植、Y_1は時刻t_1での死、Y_2は 時刻t_2での死、UはY_1,Y_2のリスクを減ら す未測定因子(ここではhaplotype)である。A はY_1のリスクを減らす ´ t_2でのhazard ratioはY_1=0の患者の中での risk ratio '(! = '(!|(" = Pr[* = 1| = 1, # = 0] Pr[* = 1| = 0, # = 0] ´ Uが存在するとY_1での条件付けでselection biasが起こる。Uで条件づければblockできる が未測定なので条件づけられない。 ´ Harzard ratioは定義上selection biasを避けられ ない。
  14. Technical Point 8.2 Multiplicative survival model ´ A,EがY=0で条件付き独⽴であることを Pr =

    0 = , = = ℎ で表す。Multiplicative survival modelという。 ´ Pr = 1 = , = = 1 − ℎ となってこれはmultiplicative mortality model とは⼀致しない。 ´ したがってY=0でAとEが条件付き独⽴であ るときはY=1では独⽴にはならない。
  15. まとめ ´ Structural selection biasはcolliderの条件付けで起こるAとYのassociationを指す。 ´ Selection biasはrandomized experimentでも起こる。 ´

    Structural approachを⽤いるメリットがある。 ´ Selection biasはIPWやstratificationで補正できる。 ´ 全てのSelectionがselection biasを⽣むわけではない。 ´ Case control研究やHazard ratioを使った研究など定義上selection biasが発⽣しやすい 研究デザインも存在する。