Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Observational studies (Causal inference: What i...

Shuntaro Sato
November 18, 2020

Observational studies (Causal inference: What if, Chapter 3)

Keywords: 因果推論, Identifiability(識別可能性), Exchangeability(交換可能性), Positivity, Consistency, Target trial

Shuntaro Sato

November 18, 2020
Tweet

More Decks by Shuntaro Sato

Other Decks in Science

Transcript

  1. 目次 2 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  2. 目次 3 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  3. 理想的な因果推論の方法 5 Xさん Xさん 原因あり A=1 原因なし A=0 結果 Y

    Xさん Xさん 結果を比較 したい 同一人物で2つの相反する状況を発生することはできないため不可能 結果 Y
  4. 事実と反事実│個人レベル 10 Xさん Xさん 結果 Y Xさん Xさん 結果 Ya=0

    事実(Xさんは心臓移植を受けた、A=1) 反事実(もしXさんが心臓移植を受けなかったら)
  5. 事実と反事実│集団レベル 13 [Ya=0┃A=1]:心臓移植を受けた(A=1)集団がもし心臓移植を受けていなかった(a=0) 時の結果Y 原因あり A=1 原因なし A=0 結果 E[Y┃A=1]

    Pr[Y┃A=1] 事実(心臓移植を受けた、A=1) 反事実(もしA=1の集団が心臓移植を受けなかったら) 結果 E[Ya=0┃A=1] Pr[Ya=0┃A=1]
  6. 因果効果Causal effectと反事実アウトカムcounterfactual outcome ┰ 本来ならば同一人物についての2つの相反する介入(A=1、A=0)の 結果(Y)の違いを比較したい ┰ つまり、事実のアウトカム(実際に観察されたアウトカム)と反事実アウトカムを比較して 因果効果Causal effectを推定したい

    =E[Ya=1]とE[Ya=0]を比較したい ┰ でも現実には反事実アウトカムYaは算出できないから、 非介入群(A=0)の集団の結果(Y)を代用することで因果効果Causal effectを推定する ┰ 非介入群(A=0)の集団の結果(Y)を代用できるかがとても大事 14
  7. 目次 21 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  8. 因果推論をするために必要な3条件 23 介入の内容が 明確になっている 介入の結果が 反事実アウトカム と一致する Consistency 一貫性 Exchangeability

    交換可能性 positivity 正値性 介入を受ける・ 受けないの傾向は 共変量Lにのみ 依存する (=影響を受ける) 共変量Lを 条件づけたときに 介入群・非介入群の どちらも 0人でないこと ちなみにこの3つをすべて合わせて識別可能性identifiabilityとよぶ
  9. 例 Table3.1で考える(L=0の人だけで考える) 28 n[Y=1│A=1]=1 n[Y=0│A=1]=3 n[Y=1│A=0]=1 n[Y=0│A=0]=3 結果(Y) 1 (あり)

    0 (なし) 計 原 因 ( A ) ( あ り ) 1 1 3 4 ( な し ) 0 1 3 4 リスク比Risk ratio= 1 4 ÷ 1 4 = 1
  10. 例 Table3.1で考える(L=1の人だけで考える) 29 n[Y=1│A=1]=6 n[Y=0│A=1]=3 n[Y=1│A=0]=2 n[Y=0│A=0]=1 結果(Y) 1 (あり)

    0 (なし) 計 原 因 ( A ) ( あ り ) 1 6 3 9 ( な し ) 0 2 1 3 リスク比Risk ratio= 6 9 ÷ 2 3 = 1
  11. 目次 33 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  12. じゃあ共変量Lを条件付けして 解析すればよいのでは? 36 そうです♪ 条件付け交換可能性conditional Exchangeability といいます 無作為化すれば交換可能性Exchangeabilityは 必ず成り立つんですね? 交換可能性Exchangeabilityが成り立つのは介入群と

    非介入群で共変量Lの分布に違いがないからです。 だからたとえ無作為化していても偶然などの理由で 共変量Lの分布に偏りが出た場合には交換可能性 Exchangeabilityは成立しません
  13. クロスオーバー試験における因果推論 40 ┰ クロスオーバー試験については(考慮すべき) アウトカムが(事実・反事実含めて) 4種類存在する ┰ 本当なら同じ時間tにおける介入の有無で 比較したいが反事実アウトカムは測定できな いためt=0の時点のアウトカムを代用する

    ┰ この4種類のアウトカムを比較し因果効果 Causal effectを推定するが、そのためには満 たしておくべき条件が3つある (Chapter 2内Fine Point2.1より) 介入あり A=1 介入なし A=0 介入あり A=1 介入なし A=0 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入なし、次(t=1)で介入ありの場合 =1 0 , 1
  14. クロスオーバー試験で因果推論するための条件その1 41 ⅰ)キャリーオーバー効果がない ┰ つまり、介入を最初に受けても後に受けて も介入によって得られるアウトカムは同じ 値になる、という仮定 ┰ キャリーオーバー効果があると、 最初(t=0)に介入を受けた場合に次(t=1)

    で介入なしになっていてもt=0で受けた 介入の効果が影響してt=1のアウトカム が変わってしまう、純粋な非介入A=0の 結果(Y)にはならない ┰ で表される 介入あり A=1 介入なし A=0 介入あり A=1 介入なし A=0 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入なし、次(t=1)で介入ありの場合 =1 0 , 1 = =1 1
  15. クロスオーバー試験で因果推論するための条件その2 42 ⅱ)因果効果Causal effectが時間経過の影響を受けない ┰ 因果効果Causal effectは左図の例だと - で表されるが、 これが時間がt=0だろうとt=1だろうと変わらないよね、

    定数(これをαi とおいている)になるという条件 ┰ ちなみにクロスオーバー試験における因果効果は 一般化すると下の式になる ┰ 観察データから何とかして↑のαi を求めるのが クロスオーバー試験における因果推論 介入あり A=1 介入なし A=0 介入あり A=1 介入なし A=0 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入なし、次(t=1)で介入ありの場合
  16. クロスオーバー試験で因果推論するための条件その3 43 ⅲ)反事実アウトカムが時間経過の影響を受けない ┰ もしA=1の時に介入を受けていなかったら・・・という反 事実アウトカムCounterfactual outcomeを考えたときに、 この反事実アウトカムが時間経過に左右されないこと (=左右されないと仮定できること) ┰

    左の例だと と をさす ┰ これが成立していないと左図でいう が 一定(定数βi とおく)でなくなり因果推論自体ができない (なぜなら因果推論は同じ時点(左の例だとt=1)に おける - で求められるから) ┰ 式で一般化すると 介入あり A=1 介入なし A=0 介入あり A=1 介入なし A=0 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入なし、次(t=1)で介入ありの場合
  17. クロスオーバー試験で因果推論するときの基本的な考え方 44 ┬ 観察できるのは = - ↑一貫性Consistencyを式にしただけ ┬ でも因果効果Causal effect(さっきのαi

    )を求めるのに 必要なのは と ┬ なので を加え、ⅱの仮定などを使うとαi を 求めることができる ⅲ)より = =βi だから 介入あり A=1 介入なし A=0 介入あり A=1 介入なし A=0 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入なし、次(t=1)で介入ありの場合
  18. クロスオーバー試験で因果推論するときの基本的な考え方 45 ┬ 観察できるのは = - ↑一貫性Consistencyを式にしただけ ┬ でも因果効果Causal effect(さっきのαi

    )を求めるのに 必要なのは と ┬ なので を加え、ⅱの仮定などを使うとαi を 求めることができる ⅲ)より = =βi だから 介入あり A=1 介入なし A=0 介入あり A=1 介入なし A=0 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入なし、次(t=1)で介入ありの場合 もしⅲ)の仮定が成り立たなかったら・・・!!┳
  19. ⅲが成り立たないときの因果推論の方法 46 ┰ まず、 - = とおく (ちなみにⅲが成り立つなら =0) ┰

    左の例より、 介入あり A=1 介入なし A=0 介入あり A=1 介入なし A=0 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入なし、次(t=1)で介入ありの場合
  20. ⅲが成り立たないときの因果推論の方法 47 ┰ まず、 - = とおく (ちなみにⅲが成り立つなら =0) ┰

    左の例より、同様にして = - 介入あり A=0 介入なし A=1 介入あり A=0 介入なし A=1 事 実 ( 観 察 で き る ) 反 事 実 ( 観 察 で き な い ) t t=0 t=1 最初(t=0)に介入あり、次(t=1)で介入なしの場合 Y1 0 =0 Y0 0 =0 Y0 1 =1 Y0 1 =1 Y1 0 =0 Y0 0 =0 Y0 1 =1 Y0 0 =0 Y1 0 =0 Y1 0 =0 Y0 0 =0 = ー + ー = - ( ー ) Y1 0 =0 Y0 0 =0
  21. ここまでの参考文献 ┏ Causal inference: What if https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/ ┏ 構造方程式モデルによる因果推論:因果構造探索に関する最近の発展 http://www.ar.sanken.osaka-

    u.ac.jp/~sshimizu/papers/BSJ2012_Tutorial_final_web.pdf ┏ UNBOUNDEDLY 健康に関する研究の読み解き方・データ分析について更新 https://www.krsk-phs.com/ ┏ Take a Risk : 林岳彦の研究メモ http://takehiko-i-hayashi.hatenablog.com/ 50
  22. 目次 51 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  23. Positivity (正値性)が成立しない!? ➢ 観察研究はPositivityが成立しない可能性がある Conditional Exchangeabilityを考えてみる (すべてのaに対して E[Ya│A=0, L] =E[Ya

    │A=1, L] ) ➢ この時、Positivityは共変量Lの組み合わせごとに成立している必要がある =Lに含まれる要因の数が増えると、Lの組み合わせのパターンも増える 53 疾患 有無 0 1 性別 0 1 ・・・ 0 1 ・・・ 0 1 ・・・ 0 1 ・・・ 0 1 ・・・ 0 1 ・・・ 0 1 ・・・ 0 1 ・・・ 0 1 Lに2値変数が10個含まれていたとすると、210=1024通り。N=3000程度のデータだと、平 均して各組に約3人しか含まれない。 ⇒全員がA=0 or A=1という状況も生じうるため、その場合はPositivityは不成立
  24. Positivityが成立しない例 ❶ 以下のような例を考えてみる 研究内容│ 乳がんの術後患者がホルモン剤を内服すると再発率が減るか (サンプル数=4900とする) • 年齢(40歳未満=0, 40歳以上=1) •

    リンパ節転移の有無(男性=0, 女性=1) • ステージ(StageI=0, StageII orStageIII=1) • 閉経状況(閉経前=0, 閉経後=1) このように層別解析を行う場合、24=16の層にわかれる。サンプル数が4900と多いから、 16層に分類しても問題ないのでは? 54
  25. Positivityが成立しない例 ❷ 年齢 リンパ節転移 ステージ 閉経 投与群 非投与群 1 0

    0 0 476 479 1 0 0 1 594 714 1 0 1 0 48 63 1 0 1 1 59 86 1 1 0 0 399 213 1 1 0 1 443 262 1 1 1 0 94 65 1 1 1 1 101 77 55
  26. 年齢 リンパ節転移 ステージ 閉経 投与群 非投与群 0 0 0 0

    137 225 0 0 0 1 1 1 0 0 1 0 17 24 0 0 1 1 0 0 0 1 0 0 139 109 0 1 0 1 2 1 0 1 1 0 38 32 0 1 1 1 0 1 Positivityが成立しない例 ❸ 56
  27. 目次 57 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  28. Consistency (一貫性) 集団レベル 58 個人レベル A=aのとき Ya =Y E [Ya┃A=a]

    = E [Y┃ A=a] 定義: A=a だった人が、仮に A=a とする介入をうけたときに取りうる反事実上のアウトカムYa は、その人たちが実際にとった値 Y と等しい。
  29. 2 1 Consistency の ( 一貫性 ) 主要な構成要素 61 反事実上の結果"

    Ya "と 観測された結果“Y”との関連性 (3.5 Consistency) 介入"a"の詳細な指定による 反事実上の結果"Ya"の正確な定義 (3.4 Consistency)
  30. ある集団において、心臓移植(A) が 5 年死亡率 (Y) に及ぼす因果関係を定量化したいと 考えているとする。 ➢ 研究に患者を登録する前に、心臓移植(A=1)と内科的治療(A=0)の2つの介入内容を詳 細に記述したプロトコルを作成

    (例)心臓移植(A=1)に割り付けられた患者は、特定の術前処置/麻酔/手術手技/術 後のケア/免疫抑制療法を受けることが明記されていた。 ➢ もし介入内容が明記されていなかったら・・・? それぞれの医師が好みの手術手技や免疫抑制療法を用いて、異なる「心臓移植」治療 を行っていた可能性 心臓移植(A)と死亡率(Y) 62 異なる治療法が実施されていて、 因果関係が異なる場合に問題が生 じる!
  31. ゼウスは40歳で肥満(A = 1)であり、49歳で致命的な心筋梗塞を起こした(Y = 1) 肥満(A=1) 肥満(A)と死亡率(Y) ❷ 64 太りやすい遺伝子を

    持っていた 運動習慣あり 健康的な食生活 腸内細菌叢も良好 死亡 他の因子は健全であったのに、遺 伝子が原因で亡くなった
  32. ゼウスは40歳で肥満(A = 1)であったが、50歳で生存していた(Y = 0) 肥満(A=1) 肥満(A)と死亡率(Y) ❸ 65 太りやすい遺伝子を

    持っていない 運動習慣なし 不健康な食生活 腸内細菌の乱れ 生存 生活習慣は不健全であるが、 遺伝子を持っていないので生存していた
  33. 介入"a"の詳細な指定による反事実上の結果"Ya"の正確な定義 ➢ 関心のある介入(状態) aを詳細に指定する必要がある もし介入(状態) aが十分に定義されていなければ、反事実上の結果Yaが十分に定義さ れていないことになり、因果効果Pr[Ya=1 = 1] ー

    Pr[Ya=0 = 1]が定義できない ➢ 理想的には、Randomized Experimentにて各個人に割り当てられた介入(状態) aを 詳細に指定し、その反事実上の結果Yaが正確に定義されるようにする。 観察研究では、研究者は研究対象となる値aを可能な限り詳細に指定する必要がある。 この作業は心臓移植のような介入では比較的簡単だが、現実世界での実際の介入に 対応していない治療でははるかに難しい。 ➢ aに複数の種類が考えられる場合をMultiple versions of treatmentという。 このとき反事実アウトカムYa=1が一意に定義されないことが問題視される。 67
  34. 介入"a"の詳細な指定による反事実上の結果"Ya"の正確な定義 68 Q. ある介入が十分に定義されているということをどのように確認するのか? “How do we know that a

    treatment is sufficiently well-defined?” A. 我々にはわからない。The answer is “We don’t.” 最大限曖昧さを排除しようと試みる必要はあるが、全ての因果関係の問題には、ある程度 の曖昧さが内在する。 曖昧さは軽減することは可能であるが、完全に排除することはできない。 因果関係の問いを精緻化することは、因果推論の基本的な要素
  35. 目次 69 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  36. 2 1 Consistency の ( 一貫性 ) 主要な構成要素 70 反事実上の結果"

    Ya "と 観測された結果“Y”に関連があるか 介入"a"の詳細な指定による 反事実上の結果" Ya "の正確な定義
  37. 毎日体重測定 (体重がベースより上回った時) 食事制限 改│肥満(A)と死亡率(Y) ❶ 71 介入群 a=1 18歳から40歳の間、対象者全員に強制的な食事制限を課す。 対照群

    a=0 介入しない 今回はa = 1とa = 0が十分に定義されており、反事実上の結果Ya=1とYa =0に曖昧さが残ら ないと専門家が同意したとする。その上で肥満と死亡率の関係を考えてみる
  38. 改│肥満(A)と死亡率(Y) ❷ (例)介入を受けていない(a = 0)にもかかわらず、18歳から40歳までほぼ一定の体重を維 持していたアレスを想定してみる 72 介入なし A=0 介入あり

    A=1 結果 Y 結果 Ya=1 事実 (アレスは介入を受けていないが体重維持) 反事実上の結果 (もしアレスが介入を受けていたら) アレス アレス アレス アレス ≠ 必ずしも一致しない
  39. 反事実上の結果“Ya”と観測された結果“Y”に関連があるか ❶ ➢ 介入を受けた対象者(a=0)のみが、分析において介入を受けた個人(A = 1)とみなされ ることを保証しなければならない。 同様に介入を受けていない対象者(a=1)のみが介入を受けていない個人(A = 0)とみ

    なされなければならない。 ➢ 観察データを用いて因果効果を定量化したいのであれば、手に入れた各個人のデー タがA = 1およびA = 0とそれぞれ一致するものが存在することが必要である。 (Positivityが保たれている必要がある) ➢ 先の例のように、介入aがよく定義されていても、 介入が観察されたデータとリンクできない場合(Consistencyの定義である等式Ya = Y が保持されていることを仮定できない場合) には役に立たない 73
  40. Consistency (一貫性) [再掲] 集団レベル 75 個人レベル A=aのとき Ya =Y E

    [Ya┃A=a] = E [Y ┃A=a] 定義: A=a だった人が仮に A=a になるような介入をうけたとすると、その時に取りうる反事実 上のアウトカムYa は、その人たちが実際にとった値 Y と等しい。
  41. 反事実上の結果“Ya”と観測された結果“Y”に関連があるか ❷ ➢ すべての治療法の効果が同一であると仮定してしまうという手もある (例)血圧の値と脳卒中の因果関係に関心がある場合 血圧の下げ方に様々な方法があるが、どの方法を用いても同様の結果が得られることが経験的 に示唆されている。その場合は介入の正確な定義づけは、潜在アウトカムと観察されたアウトカム を結びつけるためには不要であると考えられる。 ➢ 「肥満」のような不明確な定義は因果推論を複雑にするし(3.4の内容)、十分によく定義された介

    入だが対応するデータがない場合も同様(3.5の内容)。興味のある介入と手元のデータとの間の ミスマッチを検出できるように、介入を注意深く特徴づける必要がある。 このような特徴付けはRandomized Experimentsでは簡単で、いくつかの観察研究においても (治療の効果を研究するもの)比較的容易だが、生物学的および社会的要因の効果を研究する多 くの観察研究では困難または不可能といえる。 76
  42. 目次 77 3.1 Identifiability conditions 3.3 Positivity 3.2 Exchangeability 3.4

    Consistency: First, define the counterfactual outcome 3.5 Consistency: Second, link counterfactuals to the observed data 3.6 Target trial 今までの内容の復習 Chapter3 OBSERVATIONAL STUDIES
  43. The target trial 適格基準、治療戦略、アウトカム、追跡調査の開始と終了時期など研究プロトコールをで きるだけ近づけて、両研究が同じ因果関係を対象とするようにする 79 ❶ Harmonization of the

    study protocols 因果関係を推定するためのデータ分析方法をできるだけThe target trialに近づける ❷ Harmonization of the data analysis to estimate the causal effect ❶❷を揃えても説明できない結果の不一致が生じた際に、その影響を調査するための 感度分析を実施する ❸ Sensitivity analyses
  44. Technical Point 3.1 Positivity for standardization and IP weighting. •

    aにおける標準化平均の定義: σ E [Y|A=a,L=l] Pr[L=l] if [Y|A=a,L=l] >0 for all l with Pr[L=l]≠0(Positiveであるとき) • IP荷重平均 E[I(A=a)Y f[A┃L] ] ≠ E[I(A=a)Y f[a┃L] ] (Positivityが保持されない時) under exchangeabilityにおいて、 E[I(A=a)Y f[A┃L] ] = E[Ya|L∈Q(a)] Pr[L∈Q(a)] AがbinaryでありPositivityが保持されていない場合、Q(a)の定義からQ(0)はQ(1)と等しくなり得ない。こ の場合、 E[I(A=1)Y f[A┃L] ] - E[I(A=0)Y f[A┃L] ]は、under exchangeabilityでも、2つの異なるグループ間の比較である ため、因果解釈を持たない。しかしunder exchangeability で値がPositiveであればQ(1) = Q(0)が成り 立つため、平均的な因果効果として扱える 80 Slackの質問も 参照してください
  45. Technical Point 3.2 Cheating consistency • Multiple versions of treatmentな介入Rがある。この時反事実アウトカムYa=1が一意に定義され

    ないことが問題視されると過去スライドで述べたが、Multiple versions of treatment下でも Consistencyが保持される条件がある • 非肥満(肥満)の集団における体重の決定因子の分布を反映させるために、体重の決定要因を変 化させることによって全員を非肥満(肥満)に割り当てる という方法がある • このTrickは、Pr[Y = 1|A = 1]とPr[Y = 1|A = 0]を比較する多くの観察研究の分析で暗黙の了解と して使用されている(多くの場合は、他変数の条件付き)。 • 問題点:現実的な介入とは一致しない可能性(外的妥当性の担保の問題) 「調整された体重の決定要因」に介入すると、死亡率が30%減少すると示唆されたとしても、現実 的な介入(カロリー摂取量や運動レベルの変更etc)が実際に死亡率を30%減少させることを意味 するわけではない。 81
  46. Fine Point 3.3 Possible worlds(可能世界論). (Wikipediaより引 用) ➢ 可能世界論とは、論理学や哲学において、可能性・必然/偶然性等様相命題を論理的に扱うための理 論。現実に創造された世界が「全ての可能世界の中で最善のものである」と論じたもの。Stalnaker

    (1968) とLewis (1973)が可能世界論を利用し、反事実的条件文を分析。「もし~だったら、~だった だろう」と論じる時、主張の真偽は前文を満たすような最も現実世界に近い世界において、後文が真か どうかによって決定される。 (例)「トランプが大統領にならなかったら、クリントンが大統領になっていただろう」という文は「トランプが大統領にならなかった可能世界のうち、我々の現実世界に 最も近い全ての世界においてクリントンが大統領になっている」。トランプが大統領にならなかった現実世界に最も近い世界のうち、クリントンも大統領になってい ないような世界があるとすれば、この反事実条件文によって表現された主張は「偽」である、ということになる。 ➢ 科学哲学者の中には、“可能世界 ”という概念を使い因果関係の対比を定義する人もいる。結果の平均 は、1番目に近い世界ではE[Ya]、2番目の世界ではE[Ya‘] 。彼らは、E[Ya]≠E[Ya']であり、aとa‘を行う現実 世界に最も近い2つの世界がそれぞれaとa'であれば、平均的な因果関係があるとしている。 82
  47. Fine Point 3.4 Attributable fraction(寄与分画) 一定の集団において、ある因子への曝露の結果として疾病が発生したとする。 寄与分画=曝露群で疾病を生じた人で、曝露が疾病発生の原因に占める割合を示すもの。 Pr[Y=1] − Pr[Ya=1]

    Pr[Y=1] (一般的な式は RD / R 1 = R 1 – R 0 / R 1 ) Q. アンブロシア(A=1)、ネクター(A=0)のいずれかが出された夕食会の翌日アンブロシアを食べた7/10人、ネクターを 食べた1/10人が病気になった。後にアンブロシアが鳩によって汚染されていたことが判明。 アンブロシアを摂取したことが原因となった症例の割合はどの程度か? A. Pr[Y=1]=8/20=0.4。全員がA = 0の場合に観察されたリスクは、Pr[Ya=0 =1]=0.1。RDは0.4- 0.1=0.3より、全員がネクターをたべていたら、病気にならなかったであろう人が30%以上いることになる。 0.3/0.4 = 0.75より、症例の75%はA = 1に起因していると言える。もし全員がA = 0だったら2症例だけ 発生していたと考えられる。 83
  48. Take home message✉ • Exchangeability、Consistency、Positivityという3つの前提が成立すれば、観察デー タから因果効果を推定できる • 実際のデータ分析ではさらに仮定を置く必要がある • 仮定が完璧に成立することはありえない

    どのような仮定を置いているのか、それがどの程度成立していると考えうるのか を検討することが大切 • Target Trialを定め、その結果を観察データを用いてemulateできるような 研究デザインを! 84
  49. 参考・引用文献 • “データから因果関係をどう導く?:統計的因果推論の基本、「反事実モデル」をゼロから”,KRSK さんブログ, https://www.krsk-phs.com/entry/counterfactual_assumptions (2020.5.14最 終閲覧) • Miguel A.

    Hernán, James M. Robins, Using Big Data to Emulate a Target Trial When a Randomized Trial Is Not Available, American Journal of Epidemiology, Vol183, Issue 8, 15 April 2016, 758–764. • Sara Lodi et al.Effect Estimates in Randomized Trials and Observational Studies: Comparing Apples With Apples, American Journal of Epidemiology, Vol188, Issue 8, August 2019, 1569–1577. 85