Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Treatment-Confounder feedback(Causal inference:...
Search
Shuntaro Sato
November 25, 2020
Science
0
2.8k
Treatment-Confounder feedback(Causal inference: What if, Chapter 20)
Keywords: 因果推論, Treatment-confounder feedback
Shuntaro Sato
November 25, 2020
Tweet
Share
More Decks by Shuntaro Sato
See All by Shuntaro Sato
仮説検定とP値
shuntaros
8
9k
Target trial emulationの概要
shuntaros
2
2.5k
Win ratio その2
shuntaros
0
420
Win ratioとは何か?
shuntaros
0
2.3k
ICH E9 (R1) 臨床試験のための統計的原則〜中間事象に対するストラテジー
shuntaros
1
820
「回帰分析から分かること」と「変数選択」
shuntaros
14
17k
対照群がない研究デザインで効果を推定する(時系列分断デザイン・自己対照研究デザイン)
shuntaros
5
5.2k
自己対照デザイン:ケースクロスオーバーデザイン・ケースタイムコントロールデザイン
shuntaros
1
2.3k
何が知りたいのか?〜どのぐらい?に答える〜(医学統計学・疫学セミナー)
shuntaros
0
2.3k
Other Decks in Science
See All in Science
小杉考司(専修大学)
kosugitti
2
560
『データ可視化学入門』を PythonからRに翻訳した話
bob3bob3
1
500
Sociovirology
uni_of_nomi
0
100
プロダクト開発を通して学んだナレッジマネジメントの哲学
sonod
0
150
Direct Preference Optimization
zchenry
0
280
Analysis-Ready Cloud-Optimized Data for your community and the entire world with Pangeo-Forge
jbusecke
0
110
HAS Dark Site Orientation
astronomyhouston
0
5.3k
Factorized Diffusion: Perceptual Illusions by Noise Decomposition
tomoaki0705
0
220
All-in-One Bioinformatics Platform Realized with Snowflake ~ From In Silico Drug Discovery, Disease Variant Analysis, to Single-Cell RNA-seq
ktatsuya
0
230
The thin line between reconstruction, classification, and hallucination in brain decoding
ykamit
1
950
トラブルがあったコンペに学ぶデータ分析
tereka114
2
900
大規模言語モデルの開発
chokkan
PRO
84
33k
Featured
See All Featured
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
250
21k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.1k
Visualization
eitanlees
145
15k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
42
9.2k
VelocityConf: Rendering Performance Case Studies
addyosmani
325
24k
A Tale of Four Properties
chriscoyier
156
23k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Scaling GitHub
holman
458
140k
Being A Developer After 40
akosma
86
590k
The Invisible Side of Design
smashingmag
298
50k
Fireside Chat
paigeccino
34
3k
Transcript
What if 勉強会 Chapter 20 Treatment-Confounder Feedback Itsuki Osawa, MD
@Osawa_Itsuki Ver. 1.2 (2020.10.16)
What if 勉強会 本日のコンテンツ ü Chapter 19 の復習 ü 20.1
The elements of treatment-confounder feedback ü 20.2 The bias of traditional methods ü 20.3 Why traditional methods fail ü 20.4 Why traditional methods cannot be fixed ü 20.5 Adjusting for past treatment 2
What if 勉強会 19章の復習(@tamagoさんの発表内容を参照) 3 ü Sequentially randomized experiments 各時刻kにおいて治療Aが割り付けられる試験のこと
ü Sequential conditional exchangeability Time-varying treatmentの因果効果を推定するため、 各時刻kにおけるconfounder ) * k と 治療歴 ̅ , k-1 を 各時刻におけるconditional exchangeabilityの担保のために調整する ことで得られる状態 ただ未測定のconfounder Uk から Ak の直接の影響があってはいけない (Randomized/observational study共に注意) 19章 @tamagoさんのスライド
What if 勉強会 ü Static strategy と Dynamic strategy 各時刻kにおいて全て同じ治療が割り付けられるか(Static)
それぞれのCD4 cell count(! " k )によって治療法が変わる(Dynamic) Static sequential exchangeabilityを考える上では、 ! " k の調整は不要 → Static sequential exchangeabilityの仮定は弱い ü W0 のようなindicator(データベースには残っていない“定期受診に来たかどうか” の情報)の存在 Observational studiesにおいてStatic strategyでは問題にならないが、 Dynamic strategyでは正確な因果効果推定ができない原因に ü Sequential exchangeabilityが担保されており、未測定因子がFig19.5のU1 のみの時 Static/Dynamic strategy共に 因果効果推定が可能である 19章の復習(@tamagoさんの発表内容を参照) 4 19章 @tamagoさんのスライド
What if 勉強会 20.1 The elements of treatment-confounder feedback HIV陽性者に対しての治療効果(e.g.,
ART)に対する研究を想定 条件は以下の通りとする Treatment: Ak (1: treated, 0: untreated) Covariates: Lk (CD4 cell count, k= 0,1,2...K [month]) Outcome: Y (health status at month K+1) L0 →A0 , A0 →L1 (not loop⇨Fine point 20.1)の関係を Treatment-confounder feedback と呼ぶ 但しTime-varying confoundingという概念自体は Treatment-confounder feedbackがない状況でもあり得る (e.g., Fig 20.2 [A0 →L1 , A0 →U1 が消えた]) 5
What if 勉強会 Fine point 20.1 Representing feedback cycles with
acyclic graphs 6 ü Fig 20.1はacyclic graphだが、treatment-confounder feedback loop or cycleを表す → これを表現するためには各nodeが離散的な概念である必要がある → ただ各人においてnode間隔は厳密には異なるため定義上問題にならないの? ü 時間感覚は対象データの内、最小の粒度のものを採用すれば問題にはならない (Chapter 17でも同様の議論あり)
What if 勉強会 20.1 The elements of treatment-confounder feedback Fig
20.1を簡略化したFig 20.3を準備 ü L1 の効果を見たいのでL0 削除 A0 はランダムに決定, A1 はL1 のみに依存 ü U0 はとりあえず削除 ü A0 → A1 は削除 ü YはU1 のみで決定されるとする U1 は“測定されない免疫状態” ü Chapter 20の議論での多くが便宜上 A0 や A1 はYへ因果効果(sharp null hypothesis) を持たないことが仮定されているので注意 ü Lk は古典的なconfounderの概念とは異なり、Backdoor criteriaを満たす 共変量(cf. Chapter 6)と捉えた方が分かりやすいかもしれない (大沢の私見) 7
What if 勉強会 20.1 The elements of treatment-confounder feedback ü
Static treatment strategyのうち “Always treat”(a0 =1, a1 =1)と “never treat” (a0 =0, a1 =0)を比較 ü E[Y^(a0 =1, a1 =1)] - E[Y^(a0 =0, a1 =0)] でACE (Average causal effect)は求まるが、 A0 or A1からYへのpathがなく、ACE=0となる ü U1 からA1 への矢印はないので、 Sequential randomized trialと同様の状況 (Lによるconditioningでrandomization時の状況が再現可能な状況) L1 を条件付けてACEを計算したいが、 計算上はACE=0とはならない ü ここから、理論上0である因果効果が 計算上0にならないことをひたすら示していくことになる 8
What if 勉強会 20.2 The bias of traditional methods 9
実際に計算してみよう!① ü 32,000人のHIV患者について前述の研究を行う ü A0 =1のランダム割付は0.5の確率に設定、 ü A1 =1はL1 =1 (Low CD4) の時、0.8の確率に、 L1 =0 (high CD4) の時、0.4の確率に設定することにする ü Identifiability(sequential exchangeability, positivity, and consistency)を前提 i.e. L1 で調整すればsequential conditional exchangeabilityが保たれると仮定 Fig 20.3はsharp null hypothesisの元での sequentially randomized experimentを示す
What if 勉強会 20.2 The bias of traditional methods 10
実際に計算してみよう!② ü E[Y|A0 =0, L1 =0, A1 =1)] - E[Y|A0 =0, L1 =0, A1 =0)] = 0 (∵ Table 20.1) ⇒ E[Y^(a1 =1)|A0 =0, L1 =0)] - E[Y^(a1 =0)|A0 =0, L1 =0)] = 0 (∵ conditional exchangeability) ü 同様に (A0 , L1 )のどの組み合わせでもACE=0となるため、 A1 のYへのACEは0と推定される 上記の計算をしている研究者は Fig 20.3 が真のDAGであることを知らない
What if 勉強会 20.2 The bias of traditional methods 11
実際に計算してみよう!③ ü 次に重み付けを用いてA0 のYへのACEを推定したい(Standardizationで計算) E[Y|A0 =1] = E[Y|A0 =0]= 60 ⇒ E[Y^(a0 =1)] - E[Y^(a0 =0)] = 0 A0 のYへのACEは0と推定される ü ただこれらはtime-fixed treatmentの効果を見ているに過ぎない “Always treat”(a0 =1, a1 =1) vs. “never treat” (a0 =0, a1 =0)の効果を見たい 上記の計算をしている研究者は Fig 20.3 が真のDAGであることを知らない
What if 勉強会 実際に計算してみよう!⑤ (おそらくここではtime-fixed treatmentを想定) “Always treat”(a0 =1, a1
=1) vs. “never treat” (a0 =0, a1 =0)の効果を見たい ü sharp null hypothesisの元、conditional exchangeabilityが成立する条件下では、 g-null theorem(⇨Technical point 20.1 後述)より、全てのgに対してE[Yg]は不変 強いfaithfulnessの仮定より、 sharp null hypothesisは真であり、 E[Y^(a0 =1, a1 =1)] - E[Y^(a0 =0, a1 =0)] = 0 となるはず では、これらを今まで使った解析手法から求めるにはどうしたら良い? 20.2 The bias of traditional methods 12
What if 勉強会 ü Table 20.1より always treat群 と never
treat群 を計算したい ü E[Y|A0 = 1, A1 =1] = 54.7, E[Y|A0 = 0, A1 =0] = 68 であるので、 E[Y|A0 = 1, A1 =1] - E[Y|A0 = 0, A1 =0] = -13.3 (治療群が悪い結果) ü これはexchangeabilityが担保されていないことで、 E[Y^(a0 , a1 )] ≠ E[Y|A0 = a0 , A1 = a1 ] となっている可能性が考えられるので、 L1 で調整する必要がある(と研究者は思う) 20.2 The bias of traditional methods 13 そもそもこのDAGを見たら、L1 での調整は無理なことはわかるが、 g-methodsを使う必要を示すために、敢えて変な調整をしており、 余計理解がしにくくなっている (大沢の感想) 上記の計算をしている研究者は Fig 20.3 が真のDAGであることを知らない
What if 勉強会 20.2 The bias of traditional methods 14
ü 層別解析にてL1 の調整を図ろうとするが… E[Y|A0 = 1, L1 =0, A1 =1] = 76, E[Y|A0 = 0, L1 =0, A1 =0] = 84 E[Y|A0 = 1, L1 =0, A1 =1] - E[Y|A0 = 0, L1 =0, A1 =0] = -8 同様に、 E[Y|A0 = 1, L1 =1, A1 =1] - E[Y|A0 = 0, L1 =1, A1 =0] = -8 となるが、 これが0に一致しない理由は、treatment-confounder feedbackの存在がある 上記の計算をしている研究者は Fig 20.3 が真のDAGであることを知らない
What if 勉強会 20.3 Why traditional method fail 15 ü
免疫状態を反映するunmeasured variable U1 が残っているFig 20.3においても L1 での調整ができれば問題とならないが、前述の通りL1 での調整が奏功しない ü Stratificationがtreatment-confounder feedbackに対応できていない → Fig 20.5のようにL1 (collider)でのconditioningはA0 からYへのpathを開いてしまう → Stratificationを行うと、A0 へのselection biasが代償として生じてしまう
What if 勉強会 20.3 Why traditional method fail 16 ü
Confoundersが過去の治療のみに影響される時(e.g., Fig 20.3)は、 randomized /observational studiesどちらでも、今までの議論の方向性で問題ない ü Fig 20.6のようにW0 (“定期受診に来たかどうか”でデータベースには残っていない情報) が残るobservational studiesでは、biasの原因となる上、W0 の有無は判別不可 ü 他にもFig 20.7のような場合でも、 因果効果に該当しないA0 とYの関連を生む → Fine Point 20.2 ü 時刻ポイントが増え、多次元データであればあるほどこれらのbiasは増幅する G-methodsしか調整できない状況なので、問題ありありなのだが、以下の場合だと今まで考えていた以上の 問題が発生するので、そもそもどうやってconditioningする?という議論以前の問題が生じる(大沢の感想) これはmisclassificationの話にも繋がるので、treatment-confounder feedbackに特異的な話ではない(大沢の感想)
What if 勉強会 ü Confounder L1 でconditioningすると、 selection biasの原因に (e.g.,
Fig 20.5, 20.6) ü Fig 20.7においてUが存在しないと仮定のもと、 A1 のconfounderであるL1 についてstratificationを行えば、 A0 のYへの直接の因果効果(の有無)を推定できるが、 L1 を介した効果は推定不可 → Causal pathway上でAとYの間のnodeは confounderとは考えにくい (i.e., backdoor criteriaとしてはconfounderではあるが、調整すべき対象との印象を与えるconfounderとは言いにくい) ü Time-varying treatmentでは、 他時刻におけるA (e.g., A1 )も同pathway上に含まれ、 それらもYへの影響を与えるので、 Stratificationではbiasの原因に。ただg-methodsでは問題ない Fine point 20.2 Confounders on the causal pathway 17
What if 勉強会 ü そもそも、多次元データになればstratificationも不可能 (e.g., 時刻がK種類あれば、A=0,1の組み合わせを考えると2K種類存在する) ü モデリングが必要であり、例としてdose-response functionを考えてみる
→ (投与時期は関係なく)薬剤投与総量に応じて治療効果が線形増加する関数 ü cum( ̅ ") = A0 + A1 と仮定し、 “always treat” vs “never treat”を比較する E [Y| ̅ ", L1 ] = θ 0 + θ 1 cum( ̅ ") + θ 2 L1 の時、 E [Y| cum( ̅ ") =2, L1 ] - E [Y| cum( ̅ ") =0, L1 ] = 2 θ 1 Fig 20.5の場合のように Treatment-confounder feedbackの存在下ではL1 のconditioningにてA0 とYに関連が発生 → DAGからは2θ 1 = 0 となるはずだが、 L1 のconditioningにてA0 とYの関連が生じてしまい、 A0 はcum( ̅ ")の構成要素 であることから、 観測結果からは2θ 1 = 0となりようもない。この差はbiasである ü Matchingでも同様のことが言え、正確な推定にはg-methodsが欠かせない 20.4 Why traditional methods cannot be fixed 18
What if 勉強会 20.5 Adjusting for past treatment 19 ü
Fig 20.3や20.4では簡単のため、A0 からA1 への矢印を消していたが、 A0 →A1 の直接矢印が出ている場合を考える Fig 20.8はFig 20.3に対応、Fig20.9はFig 20.4に対応している
What if 勉強会 20.5 Adjusting for past treatment 20 ü
Fig 20.8やFig 20.9において、L1 でconditioningするだけではA1 とYがpathで繋がる ü 加えてFig20.10のようにA0 がYへ効果をもたらす場合は、 A0 でのconditioningも必要 → A0 がA1 とYのconfounderになっているため ü (そういえば)時点Kでの Sequential exchangeabilityを考慮する上では、 それより前の治療歴とconfounders全て がYに対して独立でなければならないということをChapter 19で学んだ 19章 @tamagoさんのスライド
What if 勉強会 20.5 Adjusting for past treatment 21 ü
̅ "を考慮するのは難しいからと、 A1 単独の治療効果を見ることに妥協しようとしても、A0 →A1 があれば、 L1 のconditioningだけでは不十分となってしまう ü そのため臨床試験は”new-user designs” のもとでtime-fixed treatmentの効果を推定 → いわゆる薬の持ち越し効果のようなものは排除したい ü Observational studiesではA0 を測定すべく、カルテレビューや患者への聞き取りが必要 → 測定結果自体はA0 *となり(cf. Chapter 9)、 A0 *自体はL1, A1 とは独立 measurement errorがindependence-nondifferentialでもbias under the nullの原因に under the alternativeであっても、効果推定におけるbiasの原因となりうる
What if 勉強会 20章のまとめ 22 ü Treatment-confounder feedbackが生じている場合は、 confoundersをstratificationで調整しても因果効果のbiasの原因となる →
parametric g-formulaでもmatchingでもうまく行かない → G-methodsを使おう! ü 上記を示すために、治療Aが効果を持たず、かつSharp null hypothesisが 成立するような極端なケースを例に議論を進めてきた ü なぜg-methodsを使わないといけないのか ① Sequential conditional exchangeabilityの仮定では、 時刻K以前全てのconfounders, 治療歴を調整しないといけない → G-methods以外では必ずbiasがどこかしらで発生する ② 複数回の経時的治療介入がなされている状態で、それらをまとめて評価する 手法がg-methods以外に存在しない → Treatment-confounder feedbackの元では、g-methodsを使わないといけない ü Chapter 21に乞うご期待! 謝辞: 個人的にフィードバックいただいた 後藤匡啓先生、後藤隆之介先生に、この場を借りて お礼申し上げます。有り難うございました。
What if 勉強会 Technical point 20.1 G-null test ü (背理法的に)Sharp
null hypothesisの成立を仮定 (then Yg = Y) (大沢注: consistencyは担保されるので、反実仮想値=観測値) Ygに対してSequential exchangeabilityが成立する場合(cf. Chapter 19) 2つの時刻(t=0,1)に限ると、以下のように表せる Y ∥ A0|L0 ・・・ ① and Y ∥ A1|A0 = g(L0), L0,L1 ・・・ ② (A0 がランダムに決定される場合, Y ∥ A0 and Y ∥ A1 |A0 = a0 , L1 ) ü ①はL0 で層別化した際のA0 の Yへの因果効果がないことを示している ü ②はA0, L0 で層別化した際のA1 の Yへの因果効果がないことを示している ü Sequential exchangeabilityが成立する場合に、 Conditional independenceが示されたnode間ではsharp null hypothesisが棄却されない (L層内でVの分布が異なり、Cancel-outによる偶然のsharp nullの可能性が考慮されておらず、上記成立は完全に示されない) 逆にconditional independenceでなければsharp null hypothesisは棄却される 23
What if 勉強会 Technical point 20.1 G-null test ü 逆にg-null
theorem (Robins 1986)として、 “sharp null hypothesis の元、Conditional exchangeabilityが保たれるのであれば、 Ygの分布と E[Yg] 両方が全てのgに対して不変であり、 これらはYの分布とE[Y]の観測値と一致するはず”だが、 ü 強いfaithfulnessの仮定下でこれらは(Yの分布とE[Y]が全てのgに対して不変であった場合) 偶然とされないため、 sharp nullの仮定が却下されないことは、sharp nullが真であることを示唆すると同義 24 6章 Sato先生のスライド
What if 勉強会 A0 およびA1 のYへのtime-fixed treatment効果は0であったが、 “Always treat”(a0 =1,
a1 =1) vs. “never treat” (a0 =0, a1 =0)の効果を見たいとする ü sharp null hypothesisの元、conditional exchangeabilityが成立する条件下では、 g-null theorem(⇨Technical point 20.1)より、全てのgに対してE[Yg]は不変 強いfaithfulnessの仮定より、 sharp null hypothesisは真であり、 E[Y^(a0 =1, a1 =1)] - E[Y^(a0 =0, a1 =0)] = 0 となるはず では、これらを今まで使った解析手法から求めるにはどうしたら良い? 20.2 The bias of traditional methods (再掲) 25