Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Selection bias(Causal inference: What if, Chapter 8)

Shuntaro Sato
November 18, 2020
3.9k

Selection bias(Causal inference: What if, Chapter 8)

Keywords: 因果推論, Selection bias(選択バイアス), Censoring(打ち切り), Confounding(交絡)

Shuntaro Sato

November 18, 2020
Tweet

More Decks by Shuntaro Sato

Transcript

  1. What If勉強会
    Chapter 8. Selection bias
    2020/06/27 宮城禎弥(@vin_tea01)

    View full-size slide

  2. 章の構成
    8.1 The structure of selection bias
    structural approachでのselection biasの定義
    8.2 Examples of selection bias
    selection biasが起きる状況の例⽰
    8.3 Selection bias and confounding
    confoundingと分ける意味
    8.4 Selection bias and censoring
    censoringを別のtreatmentとして捉える
    8.5 How to adjust for selection bias
    IPWによるselection biasの補正
    8.6 Selection without bias
    biasの起こらない場合

    View full-size slide

  3. 登場するDAG

    View full-size slide

  4. 復習(Chapter 6資料より)

    View full-size slide

  5. 8.1 The structure of selection bias
    因果構造上のselection biasの定義

    View full-size slide

  6. 単純な例
    ´ Selection bias = colliderを条件づけることでA
    とYのパスが開き生じたassociation
    ´ A: 葉酸摂取, Y: 心奇形, C: 胎児死亡
    ´ A→Yはあってもなくても発生する(bias under
    the null)
    ´ Cの子孫ノードSを固定してもパスが開き
    selection biasが発生する

    View full-size slide

  7. 複雑な例
    ´ Confoundingによるbackdoor pathを通して
    selection biasが起こる例

    View full-size slide

  8. 8.2 Examples of selection bias
    Selection biasが起こる状況

    View full-size slide

  9. Selection biasが起きる状

    Differential loss to follow-up, Informative censoring:
    実験・観察途中での脱落
    Missing data bias, non-response bias:
    データの⽋測・アンケートへの無回答
    Healthy worker bias:
    働いている⼈は⽐較的健康
    Self-selection bias, volunteer bias:
    ⾃主的に参加する背景因⼦
    Selection affected by treatment received before study entry:
    研究開始前の処置が選択に影響を及ぼす

    View full-size slide

  10. Selection biasの特徴
    ´ 前向き研究でも後ろ向き研究でも起こる。
    ´ common effectの条件付けがrandomizationの後に起こる場合、randomized experiment
    でもselection biasが発⽣する。
    ´ randomizationの前に発⽣する条件付けはrandomizationによって解消できる

    View full-size slide

  11. 8.3 Selection bias and confounding
    Confoundingと分けて考える意味

    View full-size slide

  12. 2種類のbias

    View full-size slide

  13. Traditional terminology
    ´ “selection bias”という⾔葉は、(structuralな)confoundingとselection biasの両⽅の意味
    で使われてきた
    ´ (structural) confoundingとselection biasはどちらも選択の結果⽣まれうるから
    ´ 処置群への割付の際に選択が起こるconfounding
    ´ 分析へ含める際に選択が起こるselection bias
    ´ 重要なのは、structural biasが2種類あるということ︕

    View full-size slide

  14. confoundingとselection biasを
    区別できない例
    ´ Figure 8.7では、Cの条件付けによって
    selection biasが起きている。
    ´ 分析者からはUが分からない。
    ´ Lを条件づければA←U→C←L→Yのpathは閉
    じるので、分析者からはLによるconfounding
    のようにも⾒える
    ´ confoundingとselection biasを区別できなくて
    もA→Yを調べるのに⽀障がない場合もある。

    View full-size slide

  15. Structural approachを使
    うメリット
    ´ 分析⽅法を決定する判断材料になる。
    Ex. Stratificationによるconfoundingの調整が
    selection biasを⽣む場合(Part III)
    ´ データ収集の際に必要な変数の判断材料になる。
    Ex. Figure 8.3ではLを条件づければ blockできる
    ので、Lに該当しそうな変数のデータを取って
    おく。
    ´ ある研究では共変量Lを調整することに意味が
    あって、別の研究では調整する必要がない理由
    がわかる。
    Ex. Cでselectionが発⽣していないときにYとCの
    common causeを条件付ける意味がない
    ´ Causal diagramを⽤いて円滑なコミュニケーショ
    ンを⾏える。

    View full-size slide

  16. 8.4 Selection bias and censoring
    Censoringを別のtreatmentとして捉える

    View full-size slide

  17. Censoringをもう⼀つの
    treatmentとしてみる
    ´ 本当に比べたいのはPr[!"# = 1]と
    Pr[!"$ = 1]
    ´ Cをもう1つのtreatmentとして捉えると、
    Pr[!"#,&"$ = 1]と Pr[!"$,&"$ = 1]を比べる
    ことになる
    ´ 大抵の場合はC→Yはないと考えられるので
    、treatment Cに対するconfoundingを調整して
    しまえばA→Yを考えることができる
    ´ Cについてexchangeability, positivity,
    consistencyが成り立つ必要がある
    ´ Cのconfoundingの調整方法を8.5で扱う

    View full-size slide

  18. 8.5 How to adjust for selection bias
    IPWによるselection biasの補正

    View full-size slide

  19. IPWによる調整

    View full-size slide

  20. IPWで調整できる条件
    ´ Exchangeability: AとLが同じならばCによらずYの平均が等しくなければならない。
    YとCの全てのbackdoor pathを閉じるのに⼗分な変数がLに含まれている必要がある
    が確かめようがないため、この条件はUntestable
    ´ Positivity: L内の全ての変数について少なくともuncensoredな場合にpositivityが成り
    ⽴つ。Censoredについては成り⽴たなくても良い。
    ´ Consistency: Censoringをcompeting eventで定義してはならない。例えば、deathを
    censoringの1形態としてしまうと、deathをもたらすあらゆる変数を除去しなけれ
    ばならない。

    View full-size slide

  21. Stratification
    ´ 8.3, 8.5ではLを条件づけることによってAとY
    のCを通したpathを閉じることができる。
    ´ 8.4, 8.6でも同様にCを介したpathは閉じられ
    るが、今度はLを介したpathが開いてしまい
    selection biasが生じてしまう。
    ´ IPWはLで条件づけたeffectを計算するわけで
    はないので8.4, 8.6についても問題なく適用で
    きる。
    ´ このようにstratificationが使えない状況(time-
    varying treatmentを考える場合)をPart IIIにて
    詳しく扱う。

    View full-size slide

  22. 8.6 Selection without bias
    biasの起こらないselection

    View full-size slide

  23. Conditionally independenceが保
    たれる場合
    ´ Y=1で条件づけたときAとEがassociatedにな
    っても、Y=0ではindependentのままであるこ
    とはある。
    ´ 例えばAとEが異なる機序で死Yを引き起こす
    場合、Aが引き起こすY_AとEが引き起こす
    Y_EはYと決定論的に結ばれる。
    ´ Y=0で条件づけるとA→Y←Eが開くが、Y_A
    とY_Eが自動的に0に条件づけられpathが閉じ
    るのでAとEは独立のままである。
    ´ Y=1で条件づけるとY_AとY_Eは一意に定ま
    らないので開いたpathが閉じずselection bias
    が起こる。

    View full-size slide

  24. Conditionally independenceが保たれない
    場合

    View full-size slide

  25. Fine Point, Technical Point

    View full-size slide

  26. Fine Point 8.1
    Selection bias in case-control studies
    ´ 曝露Aと疾患Yの関係を調べるcase-control studyではY=1のcase群とY=0のcontrol群
    を作り、過去の曝露Aの有無を調べる。
    ´ 研究したい集団から分析対象に選ばれるかどうか(C)は疾患Yの影響を受ける。疾
    患Yの患者はYの患者でない⼈より分析対象に選ばれる可能性は⾼い。
    ´ 曝露AもCに影響を与えうる。この時、分析対象を選ぶこと(C=1に固定すること)
    はAとYのcommon effectに対する条件付けとなりselection biasが⽣じる。
    ´ Case-control studyは定義上selection biasの影響を受けやすい研究デザインであると
    いえる。

    View full-size slide

  27. Fine Point 8.2
    The strength and direction of selection bias
    ´ “or” mechanisum: AとEが共にYのcauseであるとき、A=1 or E=1でY=1となるとする
    と、Y=1としたときAとEは負の相関になる。Y=1かつA=0ならE=1となるし、Y=1
    かつA=1ならE=0となる。
    ´ “and” mechanism: A=1 and E=1でY=1となるとすると、Y=1としたときAとEは正の
    相関になる。
    ´ selection biasはtreatmentとoutcomeがcolliderと強く相関するときに強くなる

    View full-size slide

  28. Technical Point 8.1
    The built-in selection bias of
    hazard ratio
    ´ Aを心臓移植、Y_1は時刻t_1での死、Y_2は
    時刻t_2での死、UはY_1,Y_2のリスクを減ら
    す未測定因子(ここではhaplotype)である。A
    はY_1のリスクを減らす
    ´ t_2でのhazard ratioはY_1=0の患者の中での
    risk ratio
    '(!
    = '(!|("
    =
    Pr[*
    = 1| = 1, #
    = 0]
    Pr[*
    = 1| = 0, #
    = 0]
    ´ Uが存在するとY_1での条件付けでselection
    biasが起こる。Uで条件づければblockできる
    が未測定なので条件づけられない。
    ´ Harzard ratioは定義上selection biasを避けられ
    ない。

    View full-size slide

  29. Technical Point 8.2
    Multiplicative survival model
    ´ A,EがY=0で条件付き独⽴であることを
    Pr = 0 = , = = ℎ
    で表す。Multiplicative survival modelという。
    ´ Pr = 1 = , = = 1 − ℎ
    となってこれはmultiplicative mortality model
    とは⼀致しない。
    ´ したがってY=0でAとEが条件付き独⽴であ
    るときはY=1では独⽴にはならない。

    View full-size slide

  30. まとめ
    ´ Structural selection biasはcolliderの条件付けで起こるAとYのassociationを指す。
    ´ Selection biasはrandomized experimentでも起こる。
    ´ Structural approachを⽤いるメリットがある。
    ´ Selection biasはIPWやstratificationで補正できる。
    ´ 全てのSelectionがselection biasを⽣むわけではない。
    ´ Case control研究やHazard ratioを使った研究など定義上selection biasが発⽣しやすい
    研究デザインも存在する。

    View full-size slide