Introduction The causal inference methods described so far in this book rely on a key untestable assumption: all variables needed to adjust for confounding and selection bias have been identified and correctly measured. If this assumption is incorrect–and it will always be to a certain extent–there will be residual bias in our causal estimates. It turns out that there exist other methods that can validly estimate causal effects under an alternative set of assumptions that do not require measuring all adjustment factors. Instrumental variable estimation is one of those methods. Economists and other social scientists reading this book can breathe now. We are finally going to describe a very common method in their fields, a method that is unlike any other we have discussed so far. • 交絡やselection biasをもたらす共変量を観測して調整する必要がない⼿法として、操作変数法と ⾔うものを紹介致します。 • 所々わからなかった部分もありますので、発表後・slackにて議論させてください。
Agenda • 16.1 The three instrumental conditions • 16.2 The usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
16.1 The three instrumental conditions(1/n) 正しく観測されているUを調整して、A, !間の交換可能性が成り⽴たせ、A→Yの因果効果を推定していた。 操作変数法は以下の仮定を満たす変数Zを⽤いることで、A→Yの平均因果効果の推定を試みる。 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z, A) ≠ 0) 2.ZはAを通して以外にYに影響を与えない(除外制約) 3.ZとYは common causesを持たない
16.1 The three instrumental conditions(4/n) 操作変数法も検証できない仮定に基づいている。 i. ZとAの関連性の仮定(Cov(Z, A) ≠ 0) → データから確認できる。 ii. ZはAを通して以外にYに影響を与えない(除外制約) → ZがAのみを通じてYに影響を与えていることを証明する必 要がある。 iii. ZとYは common causesを持たない → 全ての交絡の可能性を実データから検証することはできな い。 (ii)はAを条件付けても⽴証できない • 観察データで操作変数法を利⽤する場合はcandidate instruments(Z)を⽤意してそのZが仮定 を満たしているか、ドメイン知識から裏付ける必要がある。(今までの⼿法同様)
16.1 The three instrumental conditions(4/n) 仮に(i)-(iii)を満たす操作変数が⾒つかったとして、平均因果効果のBoundsは推定できるが(technical point 16.2)、平均因果効果が点推定できると⾔う訳ではない︕ homogeneity(均質性)の仮定(16.3節) or monotonicity(単調性)の仮定(16.4節) 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z, A) ≠ 0) 2.ZはAを通して以外にYに影響を与えない(除外制約) 3.ZとYは common causesを持たない 操作変数の追加条件 平均因果効果を推定するために必要な4条件
Agenda • 16.1 The three instrumental conditions • 16.2 The usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
16.2 The usual IV estimand The usual IV estimand と2SLS推定値を⽐較する。 本パートⅡのサンプルデータを使った分析 Data description: • Y: wt82_71 • A: qsmk • Z: highprice: ⽣まれた地域のタバコの82年時の価格が 1.5$を超えているか否かの⼆値変数
Agenda • 16.1 The three instrumental conditions • 16.2 The usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
16.3 A fourth identifying condition: homogeneity 3. 平均因果効果がUによらず⼀定 1. #$% − #$& = #$% − #$& 2. Uはeffect modifierである場合成り⽴たない。 3. この本の例だと、体重増加の程度#は以前の喫煙の強度Uに依存することが予想される。 4. Z-A相関の程度がUの値によらず⼀定 A = 1, − A = 0, = A = 1 − A = 0 もし、⼆値変数Aに対して、いくつかの交絡Uが観測できた場合、Uのstrataにおいて、 A = 1, − A = 0, が等 しくなるかを検証可能。 連続変数Aに対しても線形モデルを仮定して、Aの分散がUのstrataにおいて等しくなっているかを検証可能。 ?不明点? (p199)4に関して、 Unlike the previous three versions of homogeneity conditions, this one is not guaranteed to hold under the sharp causal null. なぜだかよくわかりませんでした。。
Agenda • 16.1 The three instrumental conditions • 16.2 The usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
Agenda • 16.1 The three instrumental conditions • 16.2 The usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
16.5 The three instrumental conditions revisited [| = 1] − [| = 0] [| = 1] − [| = 0] (ii), (iii) それぞれの仮定が満たされない時に⽣じる問題についてDAGsを⽤いて説明する。 ZはAを介さずにYに 影響を及ぼす The usual IV estimandの分⼦にbiasが⼊る Aは連続・多値変数 だが、coarseな∗を ⽤いるケース ZとYがcommon causeを持つ (ii) (iii) Coarsening of trt is problematic for IV estimation but not for other previous methods..? Z→A→Yが成り⽴っていたとしても、 Z→∗→Yが成り ⽴つとは限らない。 • The usual IV estimandの分⼦にbiasが⼊る • 観察データ分析だとこの可能性は拭えない。
Agenda • 16.1 The three instrumental conditions • 16.2 The usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
Agenda • 16.1 The three instrumental conditions • 16.2 The usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
Technical Point 16.3︓ Additive structural mean models and IV estimation A,Zが2値変数のケースでSaturated, additive structural mean modelを考える。 4#$ − 4#% = 1, = % + $
Fine Point 16.1 観察データ分析におけるIVの候補(疫学編) Generic Factors メンデルの独⽴の法則 遺伝的変異 ex:ALDH2 Alcohol Intake 処⽅する医師の Preference Risk coronary heart disease Gastrointestinal bleeding Physicianʼs prescribing preference for drug class Last prescription issued by physician before current prescription Nonsteroidal anti- inflammatory drugs " Z A Y Z A Y Access 次ページにて記載
Fine Point 16.1 観察データ分析におけるIVの候補(疫学編) Price of the treatment Access 禁煙の意思決定 体重増減 テキストの例もAccessibilityタイプのIVと⾔える。 Calendar period︓時間を通じて利⽤可否が変化することをIVとして利⽤ →流⾏りの処置が変わってくるケースがある(Ertefaie et al (2017)) (他の共変量も変化してくるので、IVの仮定を満たしていない可能性が⾼い。) 処置を⾏う施設までの距離・移動時間は、Aのみに影響を与える(施設の場所 が内⽣的に決まる場合はだめ*) Baiocchi et al(2010) (*) 鉄道開設による各地域間の貿易量の変化を⾒たい時に、 政策決 定者の期待が⾼い地域のみ鉄道開設がされていると、Zのランダム性が期 待できない。 ⾼⽔準の新⽣児集中治療室との 地理的近接性 サービス⽔準の異なる新⽣児 集中治療室での 出産 新⽣児のmortality