$30 off During Our Annual Pro Sale. View Details »

因果推論のための研究デザインとデータ解析

金祥太
November 10, 2022

 因果推論のための研究デザインとデータ解析

LabBase転職の主催セミナーでの講演資料です。
https://labtechtalk-event221104.peatix.com

金祥太

November 10, 2022
Tweet

More Decks by 金祥太

Other Decks in Science

Transcript

  1. 東京医科大学 医療データサイエンス分野 田栗 正隆 因果推論のための 研究デザインとデータ解析 LabTech Talk 1

  2. 自己紹介(田栗 正隆) • 経歴  2010年 東京大学大学院医学系研究科博士課程 修了  2010年

    横浜市立大学医学部 臨床統計学・疫学 助教  2014年 UCSF, Visiting Scholar(2015年まで)  2016年 横浜市立大学医学部 臨床統計学 准教授  2018年 横浜市立大学データサイエンス学部 准教授  2020年 横浜市立大学データサイエンス学部 教授  2022年 東京医科大学 医療データサイエンス分野 主任教授 • 専門・研究  医学研究のデザインと解析  疫学・臨床研究方法論、統計的因果推論 2
  3. アウトライン • 事例: BCGとCOVID-19感染の関係 • 因果効果の定義 • ランダム化比較試験 • 観察研究

     コホート研究  地域相関研究 3
  4. はじめに • 以下のデータをどう判断しますか? 4 A: 現在定期接種あり B: かつて定期接種あり現在なし C: ずっとなし

  5. 2つの解釈 • 関連  BCGワクチンを定期接種している国では、そう でない国よりもCOVID-19の感染率が低い • 因果  BCGワクチンを定期接種すれば、(そうでない

    場合よりも)COVID-19の感染率が低くなる • 結果を適切に解釈するためには、統計的因果推 論の考え方を理解しておく必要 5
  6. 6 https://www.nextias.com/current-affairs/12-10-2021/nobel-prize-for-economic-sciences-2021 自然実験 因果関係を解析する 手法への貢献 →潜在アウトカムモデル

  7. アウトライン • 事例: BCGとCOVID-19感染の関係 • 因果効果の定義 • ランダム化比較試験 • 観察研究

     コホート研究  地域相関研究 7
  8. 因果効果の定義 • ある患者が2022年1月1日に手術を受け、10 日後に死亡した • この患者に対して手術が死をもたらしたと 言えるだろうか? • 反事実の問い: 同じ患者が2022年1月1日に

    手術を受けなかった場合はどうだったか  10日後に死亡→手術は原因でない  10日後に生存→手術は原因である 8
  9. 因果推論を行うための情報 • 以下の状態を比較したい  治療Aを受けた場合のアウトカム  治療Aを受けなかった場合のアウトカム  他の条件は全て同じ •

    2つの状態でのアウトカムが異なれば、Aは 因果効果あり 9
  10. 実際に得られるデータ • Y: アウトカム(1: 死亡、0: 生存) • A: 治療(1: あり、0:

    なし) 10 ID A Y 1 1 1 2 0 0 3 1 0 4 0 0 5 1 1
  11. 理想のデータ • Ya : A = a を受けた場合に得られるであろう 潜在アウトカム(Potential Outcome)

    11 ID A Y0 Y1 効果 1 1 1 1 なし 2 0 0 0 なし 3 1 1 0 予防 4 0 0 1 悪化 5 1 1 1 なし
  12. 因果推論の根源問題 • 潜在アウトカムのうちの1つしか測定されない ため、個人の因果効果は確認できない • 集団での平均効果を定義し、推定することを 考える 12 観測データ 未観測データ

  13. 潜在アウトカムの期待値 • E[Ya ]  母集団における全ての対象者が治療aを受 けた場合のアウトカムの期待値 • 因果効果 Causal

    effect  E[Y1 ] = E[Y0 ]: 効果なし  E[Y1 ] ≠ E[Y0 ]: 効果あり 13
  14. 群別の期待値 • E[Y|A=a]  実際に治療aを受けた群毎のアウトカムの 期待値  ランダム化試験で評価しているもの • 関連

    Association  E[Y|A=1] = E[Y|A=0]: 関連なし  E[Y|A=1] ≠ E[Y|A=0]: 関連あり 14
  15. 関連と因果の違い • 因果は同じ集団における異なる状態の比較 • 関連は違う集団における異なる状態の比較 15 Hernan M, Robins JM.

    Causal Inference. Chapman & Hall/CRC, 2020.
  16. アウトライン • 事例: BCGとCOVID-19感染の関係 • 因果効果の定義 • ランダム化比較試験 • 観察研究

     コホート研究  地域相関研究 16
  17. ランダム化比較試験 • 治療Aを対象者にランダムに割付 • Aを受けたかどうかのみが違う2群が作れる  欠測がなく、割付が遵守され、2重盲検を行った 理想的な場合 17 試験群

    対照群 対象者の状態 悪い 良い
  18. ランダム化が意味すること • 潜在アウトカム  例: 手術を受けた場合(受けなかった場合) の10日後の死亡有無 • これらは、患者背景と同じく、個人毎に治療を 受ける前から持っている特性と考えられる

    • したがって、潜在アウトカムはランダム割付に より両群に均等に分布する 18
  19. ランダム化試験での背景比較 19 均等に分布

  20. ID 群 治療 アウトカム Z A Y 1 試験治療 1

    6 2 試験治療 1 5 3 試験治療 1 7 4 試験治療 1 4 5 対照治療 0 6 6 対照治療 0 3 7 対照治療 0 5 8 対照治療 0 2 潜在アウトカム Y1 Y0 6 ? 5 ? 7 ? 4 ? ? 6 ? 3 ? 5 ? 2 20 数値例 平均が等しい
  21. 完全なランダム化試験 • 試験群、対照群それぞれのデータから集団全 体の結果が分かる  E[Y|A=1] = E[Y1 ], E[Y|A=0]

    = E[Y0 ] • このとき、関連は因果を表す  単純な群間差 E[Y|A=1] – E[Y|A=0]  平均因果効果 E[Y1 ] – E[Y0 ]  両者が一致 • ランダム化試験で因果推論ができる根拠 21
  22. アウトライン • 事例: BCGとCOVID-19感染の関係 • 因果効果の定義 • ランダム化比較試験 • 観察研究

     コホート研究  地域相関研究 22
  23. コホート研究(縦断研究) 曝露群 非曝露群 疾病発生 疾病非発生 疾病発生 疾病非発生 時間 • 特定の集団(コホート)を設定、一定期間観察

    • 曝露の有無と疾病発生の関連を検討
  24. ランダム化比較試験 • 治療Aを対象者にランダムに割付 • Aを受けたかどうかのみが違う2群が作れる  欠測や脱落がなく、割付が遵守された理想 的な場合 24 試験群

    対照群 対象者の状態 悪い 良い
  25. 観察研究では • 両群間で重症度などの患者背景が異なって しまう可能性  2群間の平等な比較にならない  交絡(confounding)の問題 試験群 対照群

    対象者の状態 悪い 良い :試験治療 :対照治療
  26. 交絡 Confounding • 興味のある治療(曝露)と結果に関連する第 3の変数によって、関心のある治療-結果間 の関係が歪められてしまう現象 26 試験群 対照群 対象者の状態

    悪い 良い 26
  27. 事例:膀胱がんの術後化学療法 • 目的  浸潤性膀胱癌における膀胱全摘後のプラ チナベース補助化学療法の有効性の検討 • 対象  2004年1月から2013年12月までに6施設で

    膀胱全摘を受けた322名 27 Shimizu et al. Int J Urol. 2017;24(5):367-372
  28. 単純な解析結果(全生存期間) 28 Survival probability 0.0 0.2 0.4 0.6 0.8 1.0

    Months after surgery 0 20 40 60 80 100 Adjuvant - Adjuvant + HR = 1.49 (95%CI: 0.90-2.45) log-rank p = 0.243
  29. 術前因子の比較 29 試験群 対照群 P value 人数 74 248 年齢

    65.1 ± 10.5 68.0 ± 9.7 0.031 性別 男性 64 (86.5%) 213 (85.9%) 0.896 術前化学療法あり 10 (13.5%) 25 (10.1%) 0.405 病理学的T分類 pT0 3 (4.1%) 28 (11.3%) <.0001 pT1 5 (6.8%) 97 (39.1%) pT2 13 (17.6%) 47 (19.0%) ≥ pT3 53 (71.6%) 76 (30.6%) リンパ節転移あり 29 (39.2%) 26 (10.5%) <.0001 静脈侵襲あり 46 (62.2%) 76 (30.6%) <.0001 リンパ管侵襲あり 48 (64.9%) 86 (34.7%) <.0001 両群で術前の様々な要因が異なる: 交絡の問題
  30. 静脈侵襲による交絡 • 静脈侵襲の割合が試験群で高いために、 見かけ上試験群で死亡割合が増えてしまう 治療 死亡 静脈侵襲 関心のある 治療効果 30

  31. ランダム化より弱い仮定 • 様々な交絡因子が同じ集団を考える  例えば、70代の男性、静脈侵襲あり • この時、試験群と対照群は交換可能であると 言えるかもしれない • 多くの交絡因子Lを考慮するほど、その可能

    性は高まるだろう 31
  32. 条件付き交換可能性 • 全てのaについて以下が成立  E[Y1 |A=1,L=l] = E[Y1 |A=0,L=l] =

    E[Y1 |L=l]  E[Y0 |A=1,L=l] = E[Y0 |A=0,L=l] = E[Y0 |L=l] • 十分な交絡因子で調整した下では、未測定 の交絡はない • 注意: 観察研究で満たされる保証はない 32 | a Y A L l = 
  33. マッチングによる交絡調整 • 性別を調整したい場合  男性同士、あるいは女性同士で1人は試験治療、 1人は対照治療のペアを作る • マッチングに用いた変数は群間でバランス ID 治療

    Age Sex SBP 1 A 57 M 150 2 B 63 F 133 3 B 81 M 172 … … … … … 33
  34. 多くの交絡因子がある場合 • 年齢、性別、血圧の全てが同じ対象者を見つ けるのは、ほぼ不可能 • 傾向スコアマッチングが有効  Propensity score matching

    ID 治療 Age Sex SBP 1 A 57 M 150 2 B 63 F 133 3 B 81 M 172 … … … … … 34
  35. 傾向スコア • 治療を受ける条件付き確率  e(L) = Pr[A=1|L;α]  ロジスティック回帰モデルなどを仮定 •

    傾向スコアの性質  : eが同じなら群間でLはバランス  : eを唯一の交絡因子とみなせる • ただし、条件付き交換可能性が前提 35 | a Y A e  | A L e  Rosenbaum and Rubin, 1983.
  36. 傾向スコアの利点 • 交絡因子全てから計算される要約指標 • 条件付き交換可能性の下で唯一の交絡因子 とみなせる • 非常に多くの交絡因子を調整可能 36 ID

    治療 Age Sex SBP e 1 A 57 M 150 0.36 2 B 63 F 133 0.45 3 B 81 M 172 0.20 … … … … … … 傾向スコアが同じ 値の対象者を対照 群からマッチ
  37. マッチング前の患者背景 37 試験群 対照群 P value 人数 74 248 年齢

    65.1 ± 10.5 68.0 ± 9.7 0.031 性別 男性 64 (86.5%) 213 (85.9%) 0.896 術前化学療法あり 10 (13.5%) 25 (10.1%) 0.405 病理学的T分類 pT0 3 (4.1%) 28 (11.3%) <.0001 pT1 5 (6.8%) 97 (39.1%) pT2 13 (17.6%) 47 (19.0%) ≥ pT3 53 (71.6%) 76 (30.6%) リンパ節転移あり 29 (39.2%) 26 (10.5%) <.0001 静脈侵襲あり 46 (62.2%) 76 (30.6%) <.0001 リンパ管侵襲あり 48 (64.9%) 86 (34.7%) <.0001 両群で術前の様々な要因が異なる: 交絡の問題
  38. マッチング後の患者背景 38 試験群 対照群 P value 人数 68 68 年齢

    66.3 ± 9.9 68.4 ± 8.5 0.193 性別 男性 59 (86.8%) 56 (82.3%) 0.476 術前化学療法あり 9 (13.2%) 10 (14.7%) 0.805 病理学的T分類 pT0 3 (4.4%) 2 (2.9%) 0.796 pT1 5 (7.4%) 7 (10.3%) pT2 13 (19.1%) 16 (23.5%) ≥ pT3 47 (69.1%) 43 (63.2%) リンパ節転移あり 24 (35.4%) 18 (26.5%) 0.265 静脈侵襲あり 42 (61.7%) 38 (55.9%) 0.488 リンパ管侵襲あり 43 (63.2%) 41 (60.3%) 0.724 交絡因子は両群でほぼ均等に分布 ⇒調整がうまくいっているかデータから確認可能
  39. マッチング後の解析結果 39 Survival probability 0.0 0.2 0.4 0.6 0.8 1.0

    Months after surgery 0 20 40 60 80 100 Adjuvant - Adjuvant + HR = 0.75 (95%CI: 0.43-1.32) Stratified log-rank p = 0.324
  40. 傾向スコアマッチングの限界 • 測定した交絡因子しか調整できない  できるだけ多くの因子を測定しておく必要 • 両群で傾向スコアの分布に大きな乖離が ある場合、マッチングができない  交絡因子の偏りが強すぎ、ある因子によってほ

    ぼ決定的に治療が決まっている場合  例)新旧術式の比較における手術年 40
  41. スクイズ作戦と得点確率 41

  42. 単純な比較結果 • 得点率の差  0.544-0.540 = 0.004 42

  43. 共変量分布(調整前) 43 スクイズあり スクイズなし SMD 打率 0.21±0.07 0.27±0.04 -1.052 長打率

    0.29±0.12 0.44 ± 0.09 -1.414 次の打者の打率 0.26±0.04 0.27±0.04 -0.250 次の次の打者の打率 0.27±0.04 0.26±0.04 0.250 ホームラン率 0.01±0.01 0.04±0.02 -1.897 犠打率 0.06±0.07 0.01±0.02 0.971 盗塁成功率 0.42±0.39 0.58±0.33 -0.443 デッドボール率 0.01±0.01 0.01±0.01 0.000 打点率 0.08±0.04 0.14±0.05 -1.325 犠飛率 0.01±0.01 0.01±0.01 0.000 三振率 0.25±0.13 0.19±0.07 0.575 敬遠率 0.00±0.01 0.01±0.01 -1.000 フォアボール率 0.07±0.04 0.10±0.04 -0.750 奪三振率 0.79±0.20 0.76±0.20 0.150 セーブ率 0.02±0.08 0.02±0.09 0.000 被安打率 0.98±0.18 1.01±0.17 -0.171 被打点率 0.49±0.15 0.51±0.16 -0.129
  44. 共変量バランスの指標 • SMD(Standardized Mean Difference)  連続量の場合  2値の場合 44

    1 2 x x SD  1 2 ˆ ˆ p p SD  1 x : 群1の平均値 : 群2の平均値 2 x : 両群の標準偏差の平均値 SD 1 ˆ p : 群1の割合 : 群2の割合 2 ˆ p : 両群の標準偏差の平均値 SD ※ 絶対値で0.1-0.25未満が基準
  45. 平均因果効果の推定 • 平均因果効果(95%信頼区間)  0.182(0.092-0.300) 45 図. 1500回のブートストラップ標本に基づく平均因果効果のヒストグラム

  46. アウトライン • 事例: BCGとCOVID-19感染の関係 • 因果効果の定義 • ランダム化比較試験 • 観察研究

     コホート研究  地域相関研究 46
  47. 地域相関研究 Ecological study • 個人ではなく国や地域などの集団を単位とし て、原因と疾病の罹患率等の関係を調査 47 https://sphweb.bumc.bu.edu/otlt/MPH-Modules/PH717-QuantCore/PH717-Module1B- DescriptiveStudies_and_Statistics/PH717-Module1B-DescriptiveStudies_and_Statistics6.html

  48. BCGワクチンとCOVID-19の関係 48

  49. BCGとCOVID-19発生率・死亡率 49 A: 現在定期接種あり B: かつて定期接種あり現在なし C: ずっとなし

  50. 生態学的誤謬 Ecological fallacy • 国や地域などの要約データに基づいて、個人 レベルの因果関係を判断することに伴う誤り 50

  51. 日本ワクチン学会の声明 51 http://www.jsvac.jp/pdfs/kenkai.pdf

  52. まとめ • データから因果効果を推定するための方法 について述べた • 関連と因果の違いは潜在アウトカムモデルに より記述される • ランダム化比較試験といくつかの観察研究デ ザインとその注意点を紹介

    • 意思決定におけるデータ利活用に際して重 要な考え方