Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Selection bias(Causal inference: What if, Chapter 8)

Shuntaro Sato
November 18, 2020
4.1k

Selection bias(Causal inference: What if, Chapter 8)

Keywords: 因果推論, Selection bias(選択バイアス), Censoring(打ち切り), Confounding(交絡)

Shuntaro Sato

November 18, 2020
Tweet

Transcript

  1. 章の構成 8.1 The structure of selection bias structural approachでのselection biasの定義

    8.2 Examples of selection bias selection biasが起きる状況の例⽰ 8.3 Selection bias and confounding confoundingと分ける意味 8.4 Selection bias and censoring censoringを別のtreatmentとして捉える 8.5 How to adjust for selection bias IPWによるselection biasの補正 8.6 Selection without bias biasの起こらない場合
  2. 単純な例 ´ Selection bias = colliderを条件づけることでA とYのパスが開き生じたassociation ´ A: 葉酸摂取,

    Y: 心奇形, C: 胎児死亡 ´ A→Yはあってもなくても発生する(bias under the null) ´ Cの子孫ノードSを固定してもパスが開き selection biasが発生する
  3. Selection biasが起きる状 況 Differential loss to follow-up, Informative censoring: 実験・観察途中での脱落

    Missing data bias, non-response bias: データの⽋測・アンケートへの無回答 Healthy worker bias: 働いている⼈は⽐較的健康 Self-selection bias, volunteer bias: ⾃主的に参加する背景因⼦ Selection affected by treatment received before study entry: 研究開始前の処置が選択に影響を及ぼす
  4. Traditional terminology ´ “selection bias”という⾔葉は、(structuralな)confoundingとselection biasの両⽅の意味 で使われてきた ´ (structural) confoundingとselection

    biasはどちらも選択の結果⽣まれうるから ´ 処置群への割付の際に選択が起こるconfounding ´ 分析へ含める際に選択が起こるselection bias ´ 重要なのは、structural biasが2種類あるということ︕
  5. confoundingとselection biasを 区別できない例 ´ Figure 8.7では、Cの条件付けによって selection biasが起きている。 ´ 分析者からはUが分からない。

    ´ Lを条件づければA←U→C←L→Yのpathは閉 じるので、分析者からはLによるconfounding のようにも⾒える ´ confoundingとselection biasを区別できなくて もA→Yを調べるのに⽀障がない場合もある。
  6. Structural approachを使 うメリット ´ 分析⽅法を決定する判断材料になる。 Ex. Stratificationによるconfoundingの調整が selection biasを⽣む場合(Part III)

    ´ データ収集の際に必要な変数の判断材料になる。 Ex. Figure 8.3ではLを条件づければ blockできる ので、Lに該当しそうな変数のデータを取って おく。 ´ ある研究では共変量Lを調整することに意味が あって、別の研究では調整する必要がない理由 がわかる。 Ex. Cでselectionが発⽣していないときにYとCの common causeを条件付ける意味がない ´ Causal diagramを⽤いて円滑なコミュニケーショ ンを⾏える。
  7. Censoringをもう⼀つの treatmentとしてみる ´ 本当に比べたいのはPr[!"# = 1]と Pr[!"$ = 1] ´

    Cをもう1つのtreatmentとして捉えると、 Pr[!"#,&"$ = 1]と Pr[!"$,&"$ = 1]を比べる ことになる ´ 大抵の場合はC→Yはないと考えられるので 、treatment Cに対するconfoundingを調整して しまえばA→Yを考えることができる ´ Cについてexchangeability, positivity, consistencyが成り立つ必要がある ´ Cのconfoundingの調整方法を8.5で扱う
  8. IPWで調整できる条件 ´ Exchangeability: AとLが同じならばCによらずYの平均が等しくなければならない。 YとCの全てのbackdoor pathを閉じるのに⼗分な変数がLに含まれている必要がある が確かめようがないため、この条件はUntestable ´ Positivity: L内の全ての変数について少なくともuncensoredな場合にpositivityが成り

    ⽴つ。Censoredについては成り⽴たなくても良い。 ´ Consistency: Censoringをcompeting eventで定義してはならない。例えば、deathを censoringの1形態としてしまうと、deathをもたらすあらゆる変数を除去しなけれ ばならない。
  9. Stratification ´ 8.3, 8.5ではLを条件づけることによってAとY のCを通したpathを閉じることができる。 ´ 8.4, 8.6でも同様にCを介したpathは閉じられ るが、今度はLを介したpathが開いてしまい selection

    biasが生じてしまう。 ´ IPWはLで条件づけたeffectを計算するわけで はないので8.4, 8.6についても問題なく適用で きる。 ´ このようにstratificationが使えない状況(time- varying treatmentを考える場合)をPart IIIにて 詳しく扱う。
  10. Conditionally independenceが保 たれる場合 ´ Y=1で条件づけたときAとEがassociatedにな っても、Y=0ではindependentのままであるこ とはある。 ´ 例えばAとEが異なる機序で死Yを引き起こす 場合、Aが引き起こすY_AとEが引き起こす

    Y_EはYと決定論的に結ばれる。 ´ Y=0で条件づけるとA→Y←Eが開くが、Y_A とY_Eが自動的に0に条件づけられpathが閉じ るのでAとEは独立のままである。 ´ Y=1で条件づけるとY_AとY_Eは一意に定ま らないので開いたpathが閉じずselection bias が起こる。
  11. Fine Point 8.1 Selection bias in case-control studies ´ 曝露Aと疾患Yの関係を調べるcase-control

    studyではY=1のcase群とY=0のcontrol群 を作り、過去の曝露Aの有無を調べる。 ´ 研究したい集団から分析対象に選ばれるかどうか(C)は疾患Yの影響を受ける。疾 患Yの患者はYの患者でない⼈より分析対象に選ばれる可能性は⾼い。 ´ 曝露AもCに影響を与えうる。この時、分析対象を選ぶこと(C=1に固定すること) はAとYのcommon effectに対する条件付けとなりselection biasが⽣じる。 ´ Case-control studyは定義上selection biasの影響を受けやすい研究デザインであると いえる。
  12. Fine Point 8.2 The strength and direction of selection bias

    ´ “or” mechanisum: AとEが共にYのcauseであるとき、A=1 or E=1でY=1となるとする と、Y=1としたときAとEは負の相関になる。Y=1かつA=0ならE=1となるし、Y=1 かつA=1ならE=0となる。 ´ “and” mechanism: A=1 and E=1でY=1となるとすると、Y=1としたときAとEは正の 相関になる。 ´ selection biasはtreatmentとoutcomeがcolliderと強く相関するときに強くなる
  13. Technical Point 8.1 The built-in selection bias of hazard ratio

    ´ Aを心臓移植、Y_1は時刻t_1での死、Y_2は 時刻t_2での死、UはY_1,Y_2のリスクを減ら す未測定因子(ここではhaplotype)である。A はY_1のリスクを減らす ´ t_2でのhazard ratioはY_1=0の患者の中での risk ratio '(! = '(!|(" = Pr[* = 1| = 1, # = 0] Pr[* = 1| = 0, # = 0] ´ Uが存在するとY_1での条件付けでselection biasが起こる。Uで条件づければblockできる が未測定なので条件づけられない。 ´ Harzard ratioは定義上selection biasを避けられ ない。
  14. Technical Point 8.2 Multiplicative survival model ´ A,EがY=0で条件付き独⽴であることを Pr =

    0 = , = = ℎ で表す。Multiplicative survival modelという。 ´ Pr = 1 = , = = 1 − ℎ となってこれはmultiplicative mortality model とは⼀致しない。 ´ したがってY=0でAとEが条件付き独⽴であ るときはY=1では独⽴にはならない。
  15. まとめ ´ Structural selection biasはcolliderの条件付けで起こるAとYのassociationを指す。 ´ Selection biasはrandomized experimentでも起こる。 ´

    Structural approachを⽤いるメリットがある。 ´ Selection biasはIPWやstratificationで補正できる。 ´ 全てのSelectionがselection biasを⽣むわけではない。 ´ Case control研究やHazard ratioを使った研究など定義上selection biasが発⽣しやすい 研究デザインも存在する。