Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Observational studies (Causal inference: What if, Chapter 3)

Shuntaro Sato
November 18, 2020

Observational studies (Causal inference: What if, Chapter 3)

Keywords: 因果推論, Identifiability(識別可能性), Exchangeability(交換可能性), Positivity, Consistency, Target trial

Shuntaro Sato

November 18, 2020
Tweet

More Decks by Shuntaro Sato

Other Decks in Science

Transcript

  1. Causal inference : What If Chapter 3
    Observational studies
    1

    View full-size slide

  2. 目次
    2
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide

  3. 目次
    3
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide

  4. Causal inferenceが目指すもの
    研究のデータから原因と結果の因果効果を推定することを
    因果推論(=causal inference)という
    4
    原因(A) 結果(Y)
    原因と結果の
    因果効果(=causal effect)を知りたい

    View full-size slide

  5. 理想的な因果推論の方法
    5
    Xさん
    Xさん
    原因あり
    A=1
    原因なし
    A=0
    結果
    Y
    Xさん
    Xさん
    結果を比較
    したい
    同一人物で2つの相反する状況を発生することはできないため不可能
    結果
    Y

    View full-size slide

  6. 個人ではなく集団で比較すればいいじゃない
    6
    結果を比較
    2群の集団の人の背景因子(L,共変量、交絡因子)に差があると結果の違いを原因の有無だけで説明できない
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    結果
    E[Y┃A=0]
    Pr[Y┃A=0]

    View full-size slide

  7. 無作為化( randomised experiment)すればいい
    7
    無作為に割り付けることで対象集団の背景因子(L,共変量)にばらつきが出なくなる(はず)
    どちらの群に
    するかランダム
    に決める
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    結果
    E[Y┃A=0]
    Pr[Y┃A=0]
    結果を比較

    View full-size slide

  8. 無作為化(randomised experiment)すればよいけど・・・?
    介入できない研究、倫理的問題、手間暇かかるので無作為化が難しい
    8
    観察研究(=介入を行わない研究)から因果推論したい
    観察研究でも因果効果Causal effectを算出したい(近似したい)・・・Chpter 3で扱う内容

    View full-size slide

  9. Causal inferenceに重要な概念
    反事実(counterfactual)
    9

    View full-size slide

  10. 事実と反事実│個人レベル
    10
    Xさん
    Xさん
    結果
    Y
    Xさん
    Xさん 結果
    Ya=0
    事実(Xさんは心臓移植を受けた、A=1)
    反事実(もしXさんが心臓移植を受けなかったら)

    View full-size slide

  11. 事実と反事実│集団レベル
    11
    ※この場合はA=1の人たちもA=0の人たちも、どちらも事実
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    結果
    E[Y┃A=0]
    Pr[Y┃A=0]

    View full-size slide

  12. 事実と反事実│集団レベル
    12
    ※この場合はA=1の人たちもA=0の人たちも、どちらも事実
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    結果
    E[Y┃A=0]
    Pr[Y┃A=0]
    A=1の集団について考える

    View full-size slide

  13. 事実と反事実│集団レベル
    13
    [Ya=0┃A=1]:心臓移植を受けた(A=1)集団がもし心臓移植を受けていなかった(a=0) 時の結果Y
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    事実(心臓移植を受けた、A=1)
    反事実(もしA=1の集団が心臓移植を受けなかったら)
    結果
    E[Ya=0┃A=1]
    Pr[Ya=0┃A=1]

    View full-size slide

  14. 因果効果Causal effectと反事実アウトカムcounterfactual outcome
    ┰ 本来ならば同一人物についての2つの相反する介入(A=1、A=0)の
    結果(Y)の違いを比較したい
    ┰ つまり、事実のアウトカム(実際に観察されたアウトカム)と反事実アウトカムを比較して
    因果効果Causal effectを推定したい
    =E[Ya=1]とE[Ya=0]を比較したい
    ┰ でも現実には反事実アウトカムYaは算出できないから、
    非介入群(A=0)の集団の結果(Y)を代用することで因果効果Causal effectを推定する
    ┰ 非介入群(A=0)の集団の結果(Y)を代用できるかがとても大事
    14

    View full-size slide

  15. Causal inferenceに重要な概念
    共変量(covariates)
    15

    View full-size slide

  16. 集団同士で比較するときに問題になる背景の差
    16
    結果を比較
    2群の集団の人の背景因子に差があると結果の差異を
    原因の有無だけで説明できない→この背景因子のことを共変量(covariates,L)と呼ぶ
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    結果
    E[Y┃A=0]
    Pr[Y┃A=0]

    View full-size slide

  17. 共変量(Covariates、L)とは
    ┰交絡因子とほぼ同義
    ┰原因(A)とも関係があり、かつ結果(Y)とも関連がある因子・変数のこと
    ┰原因(A)→結果(Y)の因果効果Causal effectを推定するには
    共変量Lを調整して解析する必要がある
    17

    View full-size slide

  18. 共変量(Covariates、L)とは
    ┰ コーヒーを飲む人ほど心筋梗塞を発症しやすくなるという因果効果Causal effectがあったとする
    ┰ ただ喫煙も心筋梗塞の発症に因果がある(=喫煙する人ほど心筋梗塞を発症しやすくなる)
    ┰ 喫煙する人はコーヒーの消費量が上がる場合、喫煙は共変量にあたる
    ┰ 喫煙を調整(=喫煙の有無が心筋梗塞の発症率に影響しないようにする)した上で解析しないと
    コーヒーの摂取が心筋梗塞の発症に及ぼす純粋な効果(因果効果Causal effect)が分からなくなる
    18
    原因(A)
    例:コーヒーの摂取
    結果(Y)
    例:心筋梗塞の発症
    共変量(L)
    例:喫煙

    View full-size slide

  19. 共変量の調整方法
    ┬ このチャプターの中では、共変量Lについて、共変量が2値変数だった場合、
    因子がある(L=1)群とそうでない群(L=0)に分けたうえで
    原因(A)→結果(Y)の因果効果Causal effectを算出する方法が紹介されている
    ┬ 式にするとE[Y│A=a,L=l]をそれぞれすべてのa,lについて算出してから比較する
    ┬ 例:E[Y│A=1,L=1]・・・L=1という条件(例えば喫煙者)の中でA=1(コーヒーを飲む)人
    の結果(Y、例えば心筋梗塞の発症)の期待値
    ┬ 具体的な計算はのちほど
    19

    View full-size slide

  20. 因果推論causal inferenceにおける共変量の重要性
    ┰ 現実には反事実アウトカムYaは算出できないから、
    非介入群(A=0)の集団の結果を代用することで因果効果Causal effectを推定する(再掲)
    ┰ 非介入群(A=0)の集団の結果を代用できるかがとても大事(再掲)
    ┰ 共変量Lの分布が介入群(A=1の人)と非介入群(A=0)で違っている
    (=どちらかに偏っている)と非介入群の(A=0)の人の結果を介入群(A=1)の人の
    反事実アウトカムCounterfactual outcomeに代用できなくなる
    ┰ そうすると因果効果Causal effectは推定できない
    20

    View full-size slide

  21. 目次
    21
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide

  22. 無作為化(randomised experiment)すればよいけど・・・?
    無作為化により介入群と非介入群に分けていれば因果推論できる(再掲)
    22
    介入しない研究、倫理的問題、手間暇かかるなどの理由で無作為化が難しいことも
    観察研究でも因果関係Causal effectを算出したい(近似したい)

    View full-size slide

  23. 因果推論をするために必要な3条件
    23
    介入の内容が
    明確になっている
    介入の結果が
    反事実アウトカム
    と一致する
    Consistency
    一貫性
    Exchangeability
    交換可能性
    positivity
    正値性
    介入を受ける・
    受けないの傾向は
    共変量Lにのみ
    依存する
    (=影響を受ける)
    共変量Lを
    条件づけたときに
    介入群・非介入群の
    どちらも
    0人でないこと
    ちなみにこの3つをすべて合わせて識別可能性identifiabilityとよぶ

    View full-size slide

  24. どうしてもIdentifiabilityを満たさないときは?
    24
    Instrumental variableという予測因子を用いて
    因果効果Causal effectを求めることができます
    詳細は16章で!!
    識別可能性Identifiabilityの条件厳しくない?
    そう、そうなんです。こういうときには成り立つはずだ、
    という「仮定」のもと因果推論していく形になります。
    「仮定」についてはFine Point3.1で!!

    View full-size slide

  25. Fine point 3.1
    identifiability of causal effects
    因果効果の識別可能性
    25

    View full-size slide

  26. Identifiableとは
    把握している共変量Lを調整(条件付け)すれば原因(A)→結果(Y)の因果効果を
    推定できると仮定するとき、因果効果Causal effectは識別可能identifiableであるという。
    仮定は背景知識などにより判断する(このくらい調整してればまあいいでしょ)みたいな
    26
    原因(A)
    例:コーヒーの摂取
    結果(Y)
    例:心筋梗塞の発症
    共変量(L)
    例:喫煙

    View full-size slide

  27. 例 Table3.1で考える
    27
    ┬ 共変量Lを条件付け(調整)して
    原因(A)→結果(Y)の
    因果効果Causal effectを推定する
    ┬ L=0の人とL=1の人に分けて
    リスク比を算出してみよう

    View full-size slide

  28. 例 Table3.1で考える(L=0の人だけで考える)
    28
    n[Y=1│A=1]=1
    n[Y=0│A=1]=3
    n[Y=1│A=0]=1
    n[Y=0│A=0]=3
    結果(Y)

    (あり)
    0
    (なし)



    (

    )
    (


    )
    1 1 3 4
    (


    )
    0 1 3 4
    リスク比Risk ratio=
    1
    4
    ÷ 1
    4
    = 1

    View full-size slide

  29. 例 Table3.1で考える(L=1の人だけで考える)
    29
    n[Y=1│A=1]=6
    n[Y=0│A=1]=3
    n[Y=1│A=0]=2
    n[Y=0│A=0]=1
    結果(Y)

    (あり)
    0
    (なし)



    (

    )
    (


    )
    1 6 3 9
    (


    )
    0 2 1 3
    リスク比Risk ratio=
    6
    9
    ÷ 2
    3
    = 1

    View full-size slide

  30. つまり
    ┰ 共変量L以外には交絡因子は介在しないという仮定のもとならリスク比=1となる
    ┰ もしL以外にも共変量が存在するとしたら・・・?
    そしてその共変量が介入群(A=1)と非介入群(A=0)で違うとしたら・・・?
    ┰ ↑の場合の真のリスク比(因果リスク比)がどのようになるか考察する
    ┰ 例として、介入(A)に心臓移植、結果(Y)に死亡率を考えてみる
    30

    View full-size slide

  31. もしL以外の交絡因子が介入群に多かったら・・・
    (交絡因子を持っている人の方が死にやすい)
    介入群の方が死にやすい人が多い
    31
    ということは
    その交絡因子が介入群の死亡率を押し上げているはず
    押し上げてもリスク比=1なのであれば
    その交絡因子がなければ(ちゃんと調整していれば)リスク比は1より小さいはず

    View full-size slide

  32. もしL以外の共変量があっても
    ┰ L以外の共変量があってもそれが介入群と非介入群で均等に分布している場合は
    リスク比は1のまま変わらないことになる
    ┰ もしくは、 (・・・Lを条件付けすれば介入(A)の有無は
    反事実アウトカムYaには影響しない)が成り立つ状況でもリスク比は1のまま
    ┰ ↑はExchangeabilityの定義
    32

    View full-size slide

  33. 目次
    33
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide

  34. 無作為化しているとき(再掲)
    34
    無作為に割り付けることで対象集団の背景因子(L,共変量)にばらつきが出なくなる(はず)
    どちらの群に
    するかランダム
    に決める
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    結果
    E[Y┃A=0]
    Pr[Y┃A=0]
    結果を比較

    View full-size slide

  35. ということは
    35
    A=1のメンバーとA=0のメンバーを入れ替えたところで結果(Y)は変わらないはず
    →この入れ替えられる状況のことをExchangeability(交換可能性)という
    どちらの群に
    するかランダム
    に決める
    原因あり
    A=1
    原因なし
    A=0
    結果
    E[Y┃A=1]
    Pr[Y┃A=1]
    結果
    E[Y┃A=0]
    Pr[Y┃A=0]
    結果を比較

    View full-size slide

  36. じゃあ共変量Lを条件付けして
    解析すればよいのでは?
    36
    そうです♪
    条件付け交換可能性conditional Exchangeability
    といいます
    無作為化すれば交換可能性Exchangeabilityは
    必ず成り立つんですね?
    交換可能性Exchangeabilityが成り立つのは介入群と
    非介入群で共変量Lの分布に違いがないからです。
    だからたとえ無作為化していても偶然などの理由で
    共変量Lの分布に偏りが出た場合には交換可能性
    Exchangeabilityは成立しません

    View full-size slide

  37. 交換可能性Exchangeabilityが成り立つかどうか
    考える上で気をつけることは?
    37
    結果(Y)に影響する共変量Lを出来る限り把握していること。
    そのためには研究したいテーマ(因果効果Causal effectを
    調べたいテーマ)にどんな交絡因子が介在することが
    知られているか、よく知っておくことが大事です。
    つまり下調べをちゃんとしておく、ということです。
    観察研究はどうあがいても共変量Lが偏るから
    交換可能性Exchangeabilityは成り立たないのでは?
    結果(Y)に影響する共変量Lを
    すべて条件付けして解析するなら
    条件付き交換可能性conditional Exchangeabilityが成り立ちます

    View full-size slide

  38. 38
    とはいえ未知の交絡因子(まだ知られていない
    交絡因子)があったら
    交換可能性Exchangeabilityは成り立たないのでは?
    そうです♪
    まあそこに関しては「未知の交絡因子は想定しない」
    という「仮定」のもと因果推論するしかないと思います。

    View full-size slide

  39. Fine point 3.1
    Crossover randomized experiments
    無作為化クロスオーバー試験
    39

    View full-size slide

  40. クロスオーバー試験における因果推論
    40
    ┰ クロスオーバー試験については(考慮すべき)
    アウトカムが(事実・反事実含めて)
    4種類存在する
    ┰ 本当なら同じ時間tにおける介入の有無で
    比較したいが反事実アウトカムは測定できな
    いためt=0の時点のアウトカムを代用する
    ┰ この4種類のアウトカムを比較し因果効果
    Causal effectを推定するが、そのためには満
    たしておくべき条件が3つある
    (Chapter 2内Fine Point2.1より)
    介入あり
    A=1
    介入なし
    A=0
    介入あり
    A=1
    介入なし
    A=0


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入なし、次(t=1)で介入ありの場合

    =1

    0
    ,
    1

    View full-size slide

  41. クロスオーバー試験で因果推論するための条件その1
    41
    ⅰ)キャリーオーバー効果がない
    ┰ つまり、介入を最初に受けても後に受けて
    も介入によって得られるアウトカムは同じ
    値になる、という仮定
    ┰ キャリーオーバー効果があると、
    最初(t=0)に介入を受けた場合に次(t=1)
    で介入なしになっていてもt=0で受けた
    介入の効果が影響してt=1のアウトカム
    が変わってしまう、純粋な非介入A=0の
    結果(Y)にはならない
    ┰ で表される
    介入あり
    A=1
    介入なし
    A=0
    介入あり
    A=1
    介入なし
    A=0


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入なし、次(t=1)で介入ありの場合

    =1

    0
    ,
    1
    =
    =1

    1

    View full-size slide

  42. クロスオーバー試験で因果推論するための条件その2
    42
    ⅱ)因果効果Causal effectが時間経過の影響を受けない
    ┰ 因果効果Causal effectは左図の例だと
    - で表されるが、
    これが時間がt=0だろうとt=1だろうと変わらないよね、
    定数(これをαi
    とおいている)になるという条件
    ┰ ちなみにクロスオーバー試験における因果効果は
    一般化すると下の式になる
    ┰ 観察データから何とかして↑のαi
    を求めるのが
    クロスオーバー試験における因果推論
    介入あり
    A=1
    介入なし
    A=0
    介入あり
    A=1
    介入なし
    A=0


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入なし、次(t=1)で介入ありの場合

    View full-size slide

  43. クロスオーバー試験で因果推論するための条件その3
    43
    ⅲ)反事実アウトカムが時間経過の影響を受けない
    ┰ もしA=1の時に介入を受けていなかったら・・・という反
    事実アウトカムCounterfactual outcomeを考えたときに、
    この反事実アウトカムが時間経過に左右されないこと
    (=左右されないと仮定できること)
    ┰ 左の例だと と をさす
    ┰ これが成立していないと左図でいう が
    一定(定数βi
    とおく)でなくなり因果推論自体ができない
    (なぜなら因果推論は同じ時点(左の例だとt=1)に
    おける - で求められるから)
    ┰ 式で一般化すると
    介入あり
    A=1
    介入なし
    A=0
    介入あり
    A=1
    介入なし
    A=0


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入なし、次(t=1)で介入ありの場合

    View full-size slide

  44. クロスオーバー試験で因果推論するときの基本的な考え方
    44
    ┬ 観察できるのは = -
    ↑一貫性Consistencyを式にしただけ
    ┬ でも因果効果Causal effect(さっきのαi
    )を求めるのに
    必要なのは と
    ┬ なので を加え、ⅱの仮定などを使うとαi

    求めることができる
    ⅲ)より = =βi
    だから
    介入あり
    A=1
    介入なし
    A=0
    介入あり
    A=1
    介入なし
    A=0


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入なし、次(t=1)で介入ありの場合

    View full-size slide

  45. クロスオーバー試験で因果推論するときの基本的な考え方
    45
    ┬ 観察できるのは = -
    ↑一貫性Consistencyを式にしただけ
    ┬ でも因果効果Causal effect(さっきのαi
    )を求めるのに
    必要なのは と
    ┬ なので を加え、ⅱの仮定などを使うとαi

    求めることができる
    ⅲ)より = =βi
    だから
    介入あり
    A=1
    介入なし
    A=0
    介入あり
    A=1
    介入なし
    A=0


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入なし、次(t=1)で介入ありの場合
    もしⅲ)の仮定が成り立たなかったら・・・!!┳

    View full-size slide

  46. ⅲが成り立たないときの因果推論の方法
    46
    ┰ まず、 - = とおく
    (ちなみにⅲが成り立つなら =0)
    ┰ 左の例より、
    介入あり
    A=1
    介入なし
    A=0
    介入あり
    A=1
    介入なし
    A=0


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入なし、次(t=1)で介入ありの場合

    View full-size slide

  47. ⅲが成り立たないときの因果推論の方法
    47
    ┰ まず、 - = とおく
    (ちなみにⅲが成り立つなら =0)
    ┰ 左の例より、同様にして
    = -
    介入あり
    A=0
    介入なし
    A=1
    介入あり
    A=0
    介入なし
    A=1


    (





    )



    (






    )

    t=0 t=1
    最初(t=0)に介入あり、次(t=1)で介入なしの場合
    Y1

    0
    =0
    Y0

    0
    =0
    Y0

    1
    =1
    Y0

    1
    =1 Y1

    0
    =0
    Y0

    0
    =0
    Y0

    1
    =1 Y0

    0
    =0 Y1

    0
    =0
    Y1

    0
    =0 Y0

    0
    =0
    = ー + ー
    = - ( ー )
    Y1

    0
    =0 Y0

    0
    =0

    View full-size slide

  48. まとめると
    最初(t=0)の時に介入なし(a=0)、次(t=1)の時は介入あり(a=1)であったときは観察データに
    よる になり、逆のパターンだと になる
    ただ は未知数なので求められない
    48
    ↑の2つの式を足せば が消えるなあ~とひらめく
    しかしこの2つのパターンは全く違う状況なので2つの式を足すということはできない
    (なぜなら人生は一度きりだから)

    View full-size slide

  49. ここで使うのが無作為化Randomised experiment
    ┏ 先ほどまでは個人の話だったが、集団でクロスオーバー試験をやることを考える
    ┏ 交換可能性Exchangeabilityの定義より、無作為化により介入群A=1と非介入群A=0に割り付
    けて交絡因子の介在を排除していればそれぞれ2つの群のメンバーを入れ替えたところで
    測定されるアウトカムは入れ替える前と変わらないはずということを思い出す
    ┏ つまり集団だからA=1、A=0の2つ状況を一緒に発生させることも可能だし、交換可能性が成り
    立っていれば同一人物に2つの状況を発生させたと考えてもよい
    ┏ これで足せる・・・足せるぞ・・・・!
    ┏ 2群のアウトカムの平均値を使えばE[α
    i
    ]が求められる!
    これで因果効果Causal effectを推定できる!
    49

    View full-size slide

  50. ここまでの参考文献
    ┏ Causal inference: What if
    https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/
    ┏ 構造方程式モデルによる因果推論:因果構造探索に関する最近の発展
    http://www.ar.sanken.osaka-
    u.ac.jp/~sshimizu/papers/BSJ2012_Tutorial_final_web.pdf
    ┏ UNBOUNDEDLY 健康に関する研究の読み解き方・データ分析について更新
    https://www.krsk-phs.com/
    ┏ Take a Risk : 林岳彦の研究メモ
    http://takehiko-i-hayashi.hatenablog.com/
    50

    View full-size slide

  51. 目次
    51
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide

  52. Positivity(正値性)
    ”どのAの値をとる確率も0でない”という条件
    0でない=正の値(Positive)
    このような場合はどちらかの確率が0になってしまう
    ・・・因果推論が成り立たない!困った!
    しかしながら観察研究はPositivity(正値性)が成立しない可能性がある
    52
    A=0 A=1 A=0 A=1

    View full-size slide

  53. Positivity (正値性)が成立しない!?
    ➢ 観察研究はPositivityが成立しない可能性がある
    Conditional Exchangeabilityを考えてみる
    (すべてのaに対して E[Ya│A=0, L] =E[Ya │A=1, L] )
    ➢ この時、Positivityは共変量Lの組み合わせごとに成立している必要がある
    =Lに含まれる要因の数が増えると、Lの組み合わせのパターンも増える
    53
    疾患
    有無


    性別


    ・・・


    ・・・


    ・・・


    ・・・


    ・・・


    ・・・


    ・・・


    ・・・


    Lに2値変数が10個含まれていたとすると、210=1024通り。N=3000程度のデータだと、平
    均して各組に約3人しか含まれない。
    ⇒全員がA=0 or A=1という状況も生じうるため、その場合はPositivityは不成立

    View full-size slide

  54. Positivityが成立しない例 ❶
    以下のような例を考えてみる
    研究内容│ 乳がんの術後患者がホルモン剤を内服すると再発率が減るか
    (サンプル数=4900とする)
    • 年齢(40歳未満=0, 40歳以上=1)
    • リンパ節転移の有無(男性=0, 女性=1)
    • ステージ(StageI=0, StageII orStageIII=1)
    • 閉経状況(閉経前=0, 閉経後=1)
    このように層別解析を行う場合、24=16の層にわかれる。サンプル数が4900と多いから、
    16層に分類しても問題ないのでは?
    54

    View full-size slide

  55. Positivityが成立しない例 ❷
    年齢 リンパ節転移 ステージ 閉経 投与群 非投与群
    1 0 0 0 476 479
    1 0 0 1 594 714
    1 0 1 0 48 63
    1 0 1 1 59 86
    1 1 0 0 399 213
    1 1 0 1 443 262
    1 1 1 0 94 65
    1 1 1 1 101 77
    55

    View full-size slide

  56. 年齢 リンパ節転移 ステージ 閉経 投与群 非投与群
    0 0 0 0 137 225
    0 0 0 1 1 1
    0 0 1 0 17 24
    0 0 1 1 0 0
    0 1 0 0 139 109
    0 1 0 1 2 1
    0 1 1 0 38 32
    0 1 1 1 0 1
    Positivityが成立しない例 ❸
    56

    View full-size slide

  57. 目次
    57
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide

  58. Consistency (一貫性)
    集団レベル
    58
    個人レベル
    A=aのとき Ya =Y E [Ya┃A=a] = E [Y┃ A=a]
    定義:
    A=a だった人が、仮に A=a とする介入をうけたときに取りうる反事実上のアウトカムYa
    は、その人たちが実際にとった値 Y と等しい。

    View full-size slide

  59. 肥満の病気リスクへの影響からConsistencyを考えてみる❶
    59
    実際に肥満であった集団(A=1) について考えてみると
    E [Y|A=1]
    肥満の人たちの健康リスク平均
    E[Ya =1|A=1]
    「肥満になるような介入」の健康リスク平均

    View full-size slide

  60. 肥満の病気リスクへの影響からConsistencyを考えてみる❷
    60
    遺伝子的な
    太りやすさ?
    運動不足?
    内分泌性?
    食べすぎ?
    運動不足・食べ過ぎなどによる肥満で健康に与える影響が異なる場合、
    実際に肥満になった理由と介入によって肥満を引き起こすときの方法が違うときは
    E[Ya=1|A=1]とE[Y|A=1]が一致するとは限らない。

    View full-size slide


  61. 1
    Consistency の
    ( 一貫性 )
    主要な構成要素
    61
    反事実上の結果" Ya "と
    観測された結果“Y”との関連性
    (3.5 Consistency)
    介入"a"の詳細な指定による
    反事実上の結果"Ya"の正確な定義
    (3.4 Consistency)

    View full-size slide

  62. ある集団において、心臓移植(A) が 5 年死亡率 (Y) に及ぼす因果関係を定量化したいと
    考えているとする。
    ➢ 研究に患者を登録する前に、心臓移植(A=1)と内科的治療(A=0)の2つの介入内容を詳
    細に記述したプロトコルを作成
    (例)心臓移植(A=1)に割り付けられた患者は、特定の術前処置/麻酔/手術手技/術
    後のケア/免疫抑制療法を受けることが明記されていた。
    ➢ もし介入内容が明記されていなかったら・・・?
    それぞれの医師が好みの手術手技や免疫抑制療法を用いて、異なる「心臓移植」治療
    を行っていた可能性
    心臓移植(A)と死亡率(Y)
    62
    異なる治療法が実施されていて、
    因果関係が異なる場合に問題が生
    じる!

    View full-size slide

  63. 肥満(A)と死亡率(Y) ❶
    ある集団において、40歳時の肥満(A)が50歳までに死亡するリスク(Y)に及ぼす因果関係
    を定量化したいと考えているとする。(非肥満A=0、肥満A=1とおく)
    63
    肥満
    肥満
    非肥満
    20歳 40歳
    肥満
    非肥満
    肥満
    BMI30 BMI40
    ”40歳の時に肥満”と一言でいって
    も期間や再発性、肥満の程度な
    どにより結果が変わりうる

    View full-size slide

  64. ゼウスは40歳で肥満(A = 1)であり、49歳で致命的な心筋梗塞を起こした(Y = 1)
    肥満(A=1)
    肥満(A)と死亡率(Y) ❷
    64
    太りやすい遺伝子を
    持っていた
    運動習慣あり
    健康的な食生活
    腸内細菌叢も良好
    死亡
    他の因子は健全であったのに、遺
    伝子が原因で亡くなった

    View full-size slide

  65. ゼウスは40歳で肥満(A = 1)であったが、50歳で生存していた(Y = 0)
    肥満(A=1)
    肥満(A)と死亡率(Y) ❸
    65
    太りやすい遺伝子を
    持っていない
    運動習慣なし
    不健康な食生活
    腸内細菌の乱れ
    生存
    生活習慣は不健全であるが、
    遺伝子を持っていないので生存していた

    View full-size slide

  66. 肥満(A)と死亡率(Y) ❹
    ➢ ここで考えてみる
    “肥満(A=1)の下でのゼウスの反事実上の結果Ya=1とは何だろう??”
    ➢ ゼウスは肥満(A=1)につながる1つの状況下(遺伝子の有無)で死んだが、
    肥満(A=1)につながる別の状況下(生活習慣)では死んでいなかっただろう
    この時、 A=1の下での反事実上の結果 Ya=1 は明確でない
    (ill-defined intervention問題)
    66

    View full-size slide

  67. 介入"a"の詳細な指定による反事実上の結果"Ya"の正確な定義
    ➢ 関心のある介入(状態) aを詳細に指定する必要がある
    もし介入(状態) aが十分に定義されていなければ、反事実上の結果Yaが十分に定義さ
    れていないことになり、因果効果Pr[Ya=1 = 1] ー Pr[Ya=0 = 1]が定義できない
    ➢ 理想的には、Randomized Experimentにて各個人に割り当てられた介入(状態) aを
    詳細に指定し、その反事実上の結果Yaが正確に定義されるようにする。
    観察研究では、研究者は研究対象となる値aを可能な限り詳細に指定する必要がある。
    この作業は心臓移植のような介入では比較的簡単だが、現実世界での実際の介入に
    対応していない治療でははるかに難しい。
    ➢ aに複数の種類が考えられる場合をMultiple versions of treatmentという。
    このとき反事実アウトカムYa=1が一意に定義されないことが問題視される。
    67

    View full-size slide

  68. 介入"a"の詳細な指定による反事実上の結果"Ya"の正確な定義
    68
    Q.
    ある介入が十分に定義されているということをどのように確認するのか?
    “How do we know that a treatment is sufficiently well-defined?”
    A.
    我々にはわからない。The answer is “We don’t.”
    最大限曖昧さを排除しようと試みる必要はあるが、全ての因果関係の問題には、ある程度
    の曖昧さが内在する。
    曖昧さは軽減することは可能であるが、完全に排除することはできない。
    因果関係の問いを精緻化することは、因果推論の基本的な要素

    View full-size slide

  69. 目次
    69
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide


  70. 1
    Consistency の
    ( 一貫性 )
    主要な構成要素
    70
    反事実上の結果" Ya "と
    観測された結果“Y”に関連があるか
    介入"a"の詳細な指定による
    反事実上の結果" Ya "の正確な定義

    View full-size slide

  71. 毎日体重測定
    (体重がベースより上回った時)
    食事制限
    改│肥満(A)と死亡率(Y) ❶
    71
    介入群
    a=1
    18歳から40歳の間、対象者全員に強制的な食事制限を課す。
    対照群
    a=0
    介入しない
    今回はa = 1とa = 0が十分に定義されており、反事実上の結果Ya=1とYa =0に曖昧さが残ら
    ないと専門家が同意したとする。その上で肥満と死亡率の関係を考えてみる

    View full-size slide

  72. 改│肥満(A)と死亡率(Y) ❷
    (例)介入を受けていない(a = 0)にもかかわらず、18歳から40歳までほぼ一定の体重を維
    持していたアレスを想定してみる
    72
    介入なし
    A=0
    介入あり
    A=1
    結果
    Y
    結果
    Ya=1
    事実
    (アレスは介入を受けていないが体重維持)
    反事実上の結果
    (もしアレスが介入を受けていたら)
    アレス
    アレス
    アレス
    アレス
    ≠ 必ずしも一致しない

    View full-size slide

  73. 反事実上の結果“Ya”と観測された結果“Y”に関連があるか ❶
    ➢ 介入を受けた対象者(a=0)のみが、分析において介入を受けた個人(A = 1)とみなされ
    ることを保証しなければならない。
    同様に介入を受けていない対象者(a=1)のみが介入を受けていない個人(A = 0)とみ
    なされなければならない。
    ➢ 観察データを用いて因果効果を定量化したいのであれば、手に入れた各個人のデー
    タがA = 1およびA = 0とそれぞれ一致するものが存在することが必要である。
    (Positivityが保たれている必要がある)
    ➢ 先の例のように、介入aがよく定義されていても、
    介入が観察されたデータとリンクできない場合(Consistencyの定義である等式Ya = Y
    が保持されていることを仮定できない場合) には役に立たない
    73

    View full-size slide

  74. Positivity(正値性) [再掲]
    ”どのAの値をとる確率も0でない”という条件
    0でない=正の値(Positive)
    このような場合はどちらかの確率が0になってしまう
    ・・・因果推論が成り立たない!困った!
    しかしながら観察研究はPositivity(正値性)が成立しない可能性がある
    74
    A=0 A=1 A=0 A=1

    View full-size slide

  75. Consistency (一貫性) [再掲]
    集団レベル
    75
    個人レベル
    A=aのとき Ya =Y E [Ya┃A=a] = E [Y
    ┃A=a]
    定義:
    A=a だった人が仮に A=a になるような介入をうけたとすると、その時に取りうる反事実
    上のアウトカムYa は、その人たちが実際にとった値 Y と等しい。

    View full-size slide

  76. 反事実上の結果“Ya”と観測された結果“Y”に関連があるか ❷
    ➢ すべての治療法の効果が同一であると仮定してしまうという手もある
    (例)血圧の値と脳卒中の因果関係に関心がある場合
    血圧の下げ方に様々な方法があるが、どの方法を用いても同様の結果が得られることが経験的
    に示唆されている。その場合は介入の正確な定義づけは、潜在アウトカムと観察されたアウトカム
    を結びつけるためには不要であると考えられる。
    ➢ 「肥満」のような不明確な定義は因果推論を複雑にするし(3.4の内容)、十分によく定義された介
    入だが対応するデータがない場合も同様(3.5の内容)。興味のある介入と手元のデータとの間の
    ミスマッチを検出できるように、介入を注意深く特徴づける必要がある。
    このような特徴付けはRandomized Experimentsでは簡単で、いくつかの観察研究においても
    (治療の効果を研究するもの)比較的容易だが、生物学的および社会的要因の効果を研究する多
    くの観察研究では困難または不可能といえる。
    76

    View full-size slide

  77. 目次
    77
    3.1 Identifiability conditions
    3.3 Positivity
    3.2 Exchangeability
    3.4 Consistency: First, define the counterfactual outcome
    3.5 Consistency: Second, link counterfactuals to the observed data
    3.6 Target trial
    今までの内容の復習
    Chapter3 OBSERVATIONAL STUDIES

    View full-size slide

  78. The target trial
    観察データからの因果推論は、
    関心のあるResearch Questionに答えるRandomized Experiment
    (標的実験または標的試験)をemulate(代替)しようとする試み。
    ⇒観察データの因果推論は特定の標的試験をどの程度emulateしてい
    るかという点で評価する必要がある。
    78

    View full-size slide

  79. The target trial
    適格基準、治療戦略、アウトカム、追跡調査の開始と終了時期など研究プロトコールをで
    きるだけ近づけて、両研究が同じ因果関係を対象とするようにする
    79
    ❶ Harmonization of the study protocols
    因果関係を推定するためのデータ分析方法をできるだけThe target trialに近づける
    ❷ Harmonization of the data analysis to estimate the causal effect
    ❶❷を揃えても説明できない結果の不一致が生じた際に、その影響を調査するための
    感度分析を実施する
    ❸ Sensitivity analyses

    View full-size slide

  80. Technical Point 3.1
    Positivity for standardization and IP weighting.
    • aにおける標準化平均の定義:
    σ
    E [Y|A=a,L=l] Pr[L=l] if [Y|A=a,L=l] >0 for all l with Pr[L=l]≠0(Positiveであるとき)
    • IP荷重平均
    E[I(A=a)Y
    f[A┃L]
    ] ≠ E[I(A=a)Y
    f[a┃L]
    ] (Positivityが保持されない時)
    under exchangeabilityにおいて、 E[I(A=a)Y
    f[A┃L]
    ] = E[Ya|L∈Q(a)] Pr[L∈Q(a)]
    AがbinaryでありPositivityが保持されていない場合、Q(a)の定義からQ(0)はQ(1)と等しくなり得ない。こ
    の場合、 E[I(A=1)Y
    f[A┃L]
    ] - E[I(A=0)Y
    f[A┃L]
    ]は、under exchangeabilityでも、2つの異なるグループ間の比較である
    ため、因果解釈を持たない。しかしunder exchangeability で値がPositiveであればQ(1) = Q(0)が成り
    立つため、平均的な因果効果として扱える
    80
    Slackの質問も
    参照してください

    View full-size slide

  81. Technical Point 3.2 Cheating consistency
    • Multiple versions of treatmentな介入Rがある。この時反事実アウトカムYa=1が一意に定義され
    ないことが問題視されると過去スライドで述べたが、Multiple versions of treatment下でも
    Consistencyが保持される条件がある
    • 非肥満(肥満)の集団における体重の決定因子の分布を反映させるために、体重の決定要因を変
    化させることによって全員を非肥満(肥満)に割り当てる という方法がある
    • このTrickは、Pr[Y = 1|A = 1]とPr[Y = 1|A = 0]を比較する多くの観察研究の分析で暗黙の了解と
    して使用されている(多くの場合は、他変数の条件付き)。
    • 問題点:現実的な介入とは一致しない可能性(外的妥当性の担保の問題)
    「調整された体重の決定要因」に介入すると、死亡率が30%減少すると示唆されたとしても、現実
    的な介入(カロリー摂取量や運動レベルの変更etc)が実際に死亡率を30%減少させることを意味
    するわけではない。
    81

    View full-size slide

  82. Fine Point 3.3 Possible worlds(可能世界論). (Wikipediaより引
    用)
    ➢ 可能世界論とは、論理学や哲学において、可能性・必然/偶然性等様相命題を論理的に扱うための理
    論。現実に創造された世界が「全ての可能世界の中で最善のものである」と論じたもの。Stalnaker
    (1968) とLewis (1973)が可能世界論を利用し、反事実的条件文を分析。「もし~だったら、~だった
    だろう」と論じる時、主張の真偽は前文を満たすような最も現実世界に近い世界において、後文が真か
    どうかによって決定される。
    (例)「トランプが大統領にならなかったら、クリントンが大統領になっていただろう」という文は「トランプが大統領にならなかった可能世界のうち、我々の現実世界に
    最も近い全ての世界においてクリントンが大統領になっている」。トランプが大統領にならなかった現実世界に最も近い世界のうち、クリントンも大統領になってい
    ないような世界があるとすれば、この反事実条件文によって表現された主張は「偽」である、ということになる。
    ➢ 科学哲学者の中には、“可能世界 ”という概念を使い因果関係の対比を定義する人もいる。結果の平均
    は、1番目に近い世界ではE[Ya]、2番目の世界ではE[Ya‘] 。彼らは、E[Ya]≠E[Ya']であり、aとa‘を行う現実
    世界に最も近い2つの世界がそれぞれaとa'であれば、平均的な因果関係があるとしている。
    82

    View full-size slide

  83. Fine Point 3.4 Attributable fraction(寄与分画)
    一定の集団において、ある因子への曝露の結果として疾病が発生したとする。
    寄与分画=曝露群で疾病を生じた人で、曝露が疾病発生の原因に占める割合を示すもの。
    Pr[Y=1] − Pr[Ya=1]
    Pr[Y=1]
    (一般的な式は RD / R
    1
    = R
    1
    – R
    0
    / R
    1
    )
    Q. アンブロシア(A=1)、ネクター(A=0)のいずれかが出された夕食会の翌日アンブロシアを食べた7/10人、ネクターを
    食べた1/10人が病気になった。後にアンブロシアが鳩によって汚染されていたことが判明。
    アンブロシアを摂取したことが原因となった症例の割合はどの程度か?
    A. Pr[Y=1]=8/20=0.4。全員がA = 0の場合に観察されたリスクは、Pr[Ya=0 =1]=0.1。RDは0.4-
    0.1=0.3より、全員がネクターをたべていたら、病気にならなかったであろう人が30%以上いることになる。
    0.3/0.4 = 0.75より、症例の75%はA = 1に起因していると言える。もし全員がA = 0だったら2症例だけ
    発生していたと考えられる。
    83

    View full-size slide

  84. Take home message✉
    • Exchangeability、Consistency、Positivityという3つの前提が成立すれば、観察デー
    タから因果効果を推定できる
    • 実際のデータ分析ではさらに仮定を置く必要がある
    • 仮定が完璧に成立することはありえない
    どのような仮定を置いているのか、それがどの程度成立していると考えうるのか
    を検討することが大切
    • Target Trialを定め、その結果を観察データを用いてemulateできるような
    研究デザインを!
    84

    View full-size slide

  85. 参考・引用文献
    • “データから因果関係をどう導く?:統計的因果推論の基本、「反事実モデル」をゼロから”,KRSK
    さんブログ, https://www.krsk-phs.com/entry/counterfactual_assumptions (2020.5.14最
    終閲覧)
    • Miguel A. Hernán, James M. Robins, Using Big Data to Emulate a Target Trial
    When a Randomized Trial Is Not Available, American Journal of
    Epidemiology, Vol183, Issue 8, 15 April 2016, 758–764.
    • Sara Lodi et al.Effect Estimates in Randomized Trials and Observational
    Studies: Comparing Apples With Apples, American Journal of Epidemiology,
    Vol188, Issue 8, August 2019, 1569–1577.
    85

    View full-size slide