Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Instrumental variable estimation(Causal inference: What if, Chapter 16)

38e2af7f8bdad4f2087ab3d42b627e33?s=47 Shuntaro Sato
November 25, 2020

Instrumental variable estimation(Causal inference: What if, Chapter 16)

Keywords: 因果推論, Instrumental variable estimation(操作変数法),Homogeneity(均質性),Monotonicity(単調性)

38e2af7f8bdad4f2087ab3d42b627e33?s=128

Shuntaro Sato

November 25, 2020
Tweet

Transcript

  1. 操作変数法 Author : jumpei takubo 経済学を勉強してました。

  2. Introduction The causal inference methods described so far in this

    book rely on a key untestable assumption: all variables needed to adjust for confounding and selection bias have been identified and correctly measured. If this assumption is incorrect–and it will always be to a certain extent–there will be residual bias in our causal estimates. It turns out that there exist other methods that can validly estimate causal effects under an alternative set of assumptions that do not require measuring all adjustment factors. Instrumental variable estimation is one of those methods. Economists and other social scientists reading this book can breathe now. We are finally going to describe a very common method in their fields, a method that is unlike any other we have discussed so far. • 交絡やselection biasをもたらす共変量を観測して調整する必要がない⼿法として、操作変数法と ⾔うものを紹介致します。 • 所々わからなかった部分もありますので、発表後・slackにて議論させてください。
  3. Agenda • 16.1 The three instrumental conditions • 16.2 The

    usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
  4. 16.1 The three instrumental conditions(1/n) 正しく観測されているUを調整して、A, !間の交換可能性が成り⽴たせ、A→Yの因果効果を推定していた。 操作変数法は以下の仮定を満たす変数Zを⽤いることで、A→Yの平均因果効果の推定を試みる。 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z,

    A) ≠ 0) 2.ZはAを通して以外にYに影響を与えない(除外制約) 3.ZとYは common causesを持たない
  5. 16.1 The three instrumental conditions(3/n) 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z, A) ≠ 0)

    2.ZはAを通して以外にYに影響を与えない(除外制約) 3.ZとYは common causesを持たない ZはAを通じてYに影響する (Z:causal instrument) ZとAは! と⾔うcommon causeを持つ(Z:surrogate instrument) Zと! のcommon effect Sが 条件つけられてZとAのPathが開 いている。 利⽤時は注意が必要(16.4節参照)
  6. 16.1 The three instrumental conditions(2/n) 具体例 (i)Cov(, ) ≠ !

    = ZとYがcommon causeを持たない ⼆重盲検 Z︓{0:placebo, 1:投薬} A︓実際の処置 Y︓Outcome 配置Zと処置Aはある 程度相関あると考え る ⼆重盲検により、Uに関係 なくZは配置されている 配置Zをランダムに決定してい るから満たす 禁煙が体重増加を もたらすか A:禁煙 Y:体重の変化 " :煙草価格(*) タバコの価格は禁煙 の意思決定に影響を 与えている 価格変化は個々⼈の体 重と、A以外のpathで影 響を与えていない。 価格変化と体重変化は common causeを持つとは 考えない。 (*) 本例では、正確には Causal instrument " ︓Price in place of residence Surrogate instrument ︓Price in place of birth で分析している。
  7. 16.1 The three instrumental conditions(4/n) 操作変数法も検証できない仮定に基づいている。 i. ZとAの関連性の仮定(Cov(Z, A) ≠

    0) → データから確認できる。 ii. ZはAを通して以外にYに影響を与えない(除外制約) → ZがAのみを通じてYに影響を与えていることを証明する必 要がある。 iii. ZとYは common causesを持たない → 全ての交絡の可能性を実データから検証することはできな い。 (ii)はAを条件付けても⽴証できない • 観察データで操作変数法を利⽤する場合はcandidate instruments(Z)を⽤意してそのZが仮定 を満たしているか、ドメイン知識から裏付ける必要がある。(今までの⼿法同様)
  8. 16.1 The three instrumental conditions(4/n) 仮に(i)-(iii)を満たす操作変数が⾒つかったとして、平均因果効果のBoundsは推定できるが(technical point 16.2)、平均因果効果が点推定できると⾔う訳ではない︕ homogeneity(均質性)の仮定(16.3節) or

    monotonicity(単調性)の仮定(16.4節) 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z, A) ≠ 0) 2.ZはAを通して以外にYに影響を与えない(除外制約) 3.ZとYは common causesを持たない 操作変数の追加条件 平均因果効果を推定するために必要な4条件
  9. Agenda • 16.1 The three instrumental conditions • 16.2 The

    usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
  10. 16.2 The usual IV estimand [| = 1] − [|

    = 0] [| = 1] − [| = 0] Usual IV estimand for dichotomous Z ZはA同様⼆値変数とし、操作変数法の3つの仮定と第4の均質性の仮定を満たすとする。この時 平均因果効果 !"# − [!"$]は以下の推定量で識別される。 AとZが連続変数の場合は線形モデルを考えた場合、%&'(),+) %&'(-.,+) が求めたいIV推定量となる。
  11. 16.2 The usual IV estimand(2/! ) [| = 1] −

    [| = 0] [| = 1] − [| = 0] Usual IV estimand for dichotomous Z 分⼦は、ZのYへの平均因果効果となっており、これはITT効果と解釈できる。 分⺟は、ZのAへの平均因果効果となっており、これはどれだけassignmentと treatmentが⼀致しているかの指標になっている。 • [| = 1] − [| = 0]=1だとIV estimandはITT推定量 • IV estimandは交絡調整する代わりにITT推定量から adheranceしてない割合を拡⼤させている。
  12. 16.2 The usual IV estimand(2/! ) Martens et al(2006)によるIV estimandの幾何学的な解釈。

    Martens et al(2006)の例では、 ITT︓98g A: quit smokingが Zに応じて、Aが0.20から0.43に変化することで、 98g増加する。 本当に欲しいATEは、「Aが0から1に変化した」と きのYの変分なので、これを拡張している。 ( #.$ $./01$.2$ 倍) (Martens et al(2006)では、 = + A + と⾔う specificationを⾒るに、oldest homogeneityの仮定を敷いている と思われる。
  13. 16.2 The usual IV estimand The usual IV estimand と2SLS推定値を⽐較する。

    本パートⅡのサンプルデータを使った分析 Data description: • Y: wt82_71 • A: qsmk • Z: highprice: ⽣まれた地域のタバコの82年時の価格が 1.5$を超えているか否かの⼆値変数
  14. 16.2 The usual IV estimand The usual IV estimand と2SLS推定値を⽐較する。

    2SLS 1st stage • A(qsmk)をZ(highprice)で回帰する • 予測値 , (A_pred)を得る 2nd stage • Y(wt82_71)を , (A_pred)で回帰する。 • , のパラメタが2SLS Estimateとなる。 これがなんでusual IV estimandと⼀緒になるのかは、 mns_econさんのスライドを参照。
  15. 16.2 The usual IV estimand(2/! ) Zの変動を利⽤してAを動かすことで、Uに関係ないAの変動からYへの 効果を推定できる。 • =

    1 − = 0 →3 • = 1 − = 0 →3 経済学徒がかつて習ったIV推定量の直感的説明(⼭⼝ 2019) • 選択バイアスが発⽣している場合は、IP weightingを⽤いて調整したのちIV推定する必要があります。 • 余談ですが、経済学のコースワークで学ぶ操作変数法は、 1. (全ての個⼈が均⼀の効果を持つと⾔う)rank-preservedな線形モデルを扱います。 2. Z, Aともに、continuous variableの場合を扱いました(smooth model)
  16. Agenda • 16.1 The three instrumental conditions • 16.2 The

    usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
  17. 16.3 A fourth identifying condition: homogeneity 16.2節のusual IV estimandは、実はこの仮定を暗に置いている元でのATEとなっている。 ATEを推定するためのHomogeneityの仮定は4つ知られている。

    1. Oldest : 全員の因果効果が等しい(cf. rank preservation) 2. On the treated と on the untreatedそれぞれ、 Zに関わらず平均因果効果が等しい(16.2 節で利⽤している。詳しくはtechnical point 16.2を参照) !"# − !"$ = 1, = = !"# − !"$ = 0, =
  18. 16.3 A fourth identifying condition: homogeneity 3. 平均因果効果がUによらず⼀定 1. #$%

    − #$& = #$% − #$& 2. Uはeffect modifierである場合成り⽴たない。 3. この本の例だと、体重増加の程度#は以前の喫煙の強度Uに依存することが予想される。 4. Z-A相関の程度がUの値によらず⼀定 A = 1, − A = 0, = A = 1 − A = 0 もし、⼆値変数Aに対して、いくつかの交絡Uが観測できた場合、Uのstrataにおいて、 A = 1, − A = 0, が等 しくなるかを検証可能。 連続変数Aに対しても線形モデルを仮定して、Aの分散がUのstrataにおいて等しくなっているかを検証可能。 ?不明点? (p199)4に関して、 Unlike the previous three versions of homogeneity conditions, this one is not guaranteed to hold under the sharp causal null. なぜだかよくわかりませんでした。。
  19. 16.3 A fourth identifying condition: homogeneity 多くの場合、Homogeneityの仮定は正しいとは⾔えないため、 標本集団の平均因果効果としてIV estimandを解釈するのは難しい。 ⼆つの回避⽅法がある。

    1. Covariatesを含んだモデルを考えてIV法を利⽤する。 1. この時、パラメトリックな仮定を線形モデル(eg. 2SLS)より課さないことからStructural mean modelを利⽤すると相 対的に安全である。 2. Covariatesを含むことによって、ZをEMとして扱うことができる。(処置効果が共変量のstrata内でどう変化するかに関 してある程度の制約が必要) 2. Homogeneityの仮定ではなく、単調性の仮定を利⽤する。(16.4節) 1. この時、分析対象の集団における平均因果効果は識別してないこと注意する。
  20. Agenda • 16.1 The three instrumental conditions • 16.2 The

    usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
  21. 16.4 An alternative fourth condition: monotonicity 4と⾔うcountefactualな「もしzに配置された時に処置を受けるか」の変数を考え、被験者が4分類す る。 z=1であろうが0であろうが、必ず処 置を受ける

    "#$ = 1, "#% = 1 z=1であろうが0であろうが、必ず処 置を受けない "#$ = 0, "#% = 0 z=1の時処置を受けないのに、 z=0では処置を受ける "#$ = 0, "#% = 0 z=1の時は処置を受け、z=0の時 は処置を受けない "#$ = 1, "#% = 0 Always Takers NeverTakers Defiers Compliers
  22. 16.4 An alternative fourth condition: monotonicity 注意点︓ Z=1の時A=1(0)になったとしても、complier なのか、Always takerなのかはわからない。(Defierな

    のか、never takesなのかわからない。) 同様に、Z=0の時A=1(0)になったとしても、Defier なのか、Always takerなのかはわからない。 (compliersなのか、Never takerなのかわからない。) Z=0 A=1 A=0 Z=1 A=1 Always taker Compliers A=0 Defiers Never takers
  23. 16.4 An alternative fourth condition: monotonicity • monotonicity(単調性)の仮定とは︖ • Defiersが存在しないと仮定して、4"#

    ≥ 4"$が成り⽴つと仮定すること。 • この仮定と、Zがランダム配置変数である条件のもとで、因 果効果が推定できます。 • しかし、 IV estimandは[!"# − !"$]とはならず、 • 遵守者のみを対象にした平均因果効果となる。 !"# − !"$ 4"# = 1, 4"$ = 0 • 局所的平均因果効果(LATE)の⼀種になる。 ※この本の例では観察データなので、Zはtreatment assignmentではない。 したがってcompliersは「価格が⾼い州にいる時は喫煙をやめる」⼈々 Defiersは「価格が⾼い時だけ喫煙を続けよう」と⾔う天邪⻤と⾔う設定となる。
  24. 16.4 An alternative fourth condition: monotonicity 分⼦︓ ZのYへの効果はAlways-takers, never-takersの効果が0になる ので、分⼦はcompliersのみのZのYへの効果となる。

    分⺟︓ Zはrandom assignmentとすると、(, は独⽴になるので、 分⺟は[()* − ()+]となり(*)、標本集団に含まれるcompliers の割合となる 678 − 679 :78 = 1, :79 = 0 = = 1 − [| = 0] = 1 − [| = 0] (*)["#$ − "#%] = = 1 − = 0 Pr(compliers)+Pr(Always-takers) - Pr(Always-takers) ざっくり証明(詳細はtechnical point 16.6)
  25. 16.4 An alternative fourth condition: monotonicity Monotonicityの仮定は、homogeneityの仮定と⽐べるとplausibleっぽい。 しかしいくつかの観点からの批判もされている。(ここでは3つ紹介する。) 1. ComplierへのZ-A関連性は、⽤いる操作変数によって変わってくるだろうし、個々のcomplierの識別ができるわけで

    はないので、それを検証できない。 • 従って、政策決定者は、complierに対する効果がわかったところで、利⽤し⾟い。
  26. 16.4 An alternative fourth condition: monotonicity 2. Monotonicityは観察データ研究において必ずしも成り⽴つわけではない。 • Defiersがいないと⾔う仮定は正しいか︖天邪⻤がいないと⾔い切れる︖

    • 「配置されなければ受けられない」設定→Always takers, defiersは存在しないと⾔える。 • Proxy instruments(Fig.16.2/3)においてさらに複雑になる。 Preferenceを操作変数に異なる2⼈の医師の処⽅の違い • 医師(Z=1)は、肥満な⼈以外 処置する • 医師(Z=0)は、元気な⼈だけ処 置する • 元気で肥満な⼈はdefiersになっ てまう。。 • "#$ = 0, "#% = 1 ≠ 0
  27. 16.4 An alternative fourth condition: monotonicity Monotonicityの仮定に対する本⽂中の最後の批判 3. 被験者集団の4分割って正しいのか︖ 医師の選好をIVとする場合、同じpreferenceを持つ全ての医師が同じようにここの患者を扱うことが必要となる。

    その他、安定的なtype分けをするためには以下の仮定が必要となる。 • Deterministic counterfactual • Ex:Always takerであるならば必ず、["] = 1 ∀と⾔うこと︖ • No interference • 他の被験者の状況に応じて、typeが変わることがない。 • Absense of multiple versions of treatment and No Other heterogeneity • あるIVでは、Complierで、別のIVだとcomplierではないかもしれない。 以上3つの批判から • そもそも compliersの効果識別によって、政策決定のサポートができるかはちゃんと考えないといけな い。 • ちゃんと操作変数の3つの仮定を満たしていたとしても、観察研究や、より複雑な設定の元でのこの仮 定が成り⽴つか⼗分に注意しないといけない。
  28. Agenda • 16.1 The three instrumental conditions • 16.2 The

    usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
  29. 16.5 The three instrumental conditions revisited • (, )が⼩さい時に⽣じる問題のこと。 •

    この時、3つの深刻な問題が⽣じる。 弱操作変数 操作変数法の(i)Z,Aは相関・因果関係をもつと⾔う仮定は検証できる。 1. Wide 95%信頼区間を⽣み出す。 2. 弱操作変数は、(ii)(iii)を満たさない場合、そのbiasを増幅させてしまう。 3. ⼤標本においても、バイアスの元になり、分散の過⼩推定を引き起こしてしまう。 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z, A) ≠ 0) 2.ZはAを通して以外にYに影響を与えない(除外 制約) 3.ZとYは common causesを持たない ?不明点?(もう少し精読予定) なぜ分散が過⼩に推定されてしまうのか︖
  30. 16.5 The three instrumental conditions revisited [| = 1] −

    [| = 0] [| = 1] − [| = 0] (ii), (iii) それぞれの仮定が満たされない時に⽣じる問題についてDAGsを⽤いて説明する。 ZはAを介さずにYに 影響を及ぼす The usual IV estimandの分⼦にbiasが⼊る Aは連続・多値変数 だが、coarseな∗を ⽤いるケース ZとYがcommon causeを持つ (ii) (iii) Coarsening of trt is problematic for IV estimation but not for other previous methods..? Z→A→Yが成り⽴っていたとしても、 Z→∗→Yが成り ⽴つとは限らない。 • The usual IV estimandの分⼦にbiasが⼊る • 観察データ分析だとこの可能性は拭えない。
  31. Agenda • 16.1 The three instrumental conditions • 16.2 The

    usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
  32. 16.6 Instumental variable estimation versus other methods Other approach: RDD

    1. IV法は⼤標本においてもモデルの仮定を要する。 2. 操作変数法の仮定の違反は⼤きいバイアスを⽣じさせる。 3. 操作変数が機能する場⾯はとても限定的︕ 1. 通常、 2. 観測出来ない交絡が多すぎる。 3. Time fixed(である必要ある︖)で⼆値 4. 単調性・同質性の仮定が成⽴していそう Causal Inferenceは仮定の信憑性と、異なる仮定に依存する様々な⼿法から導かれる結果の質 的・量的な分析に依存する。 IV法は今まで学習してきた⼿法と異なる仮定に基づく魅⼒的な⼿法だが、95%信頼区間が⼤きくなっ てしまうデメリットから付加価値はそんな⾼くない。 IV法を利⽤する際は、仮定をちゃんと満たしているか批判されてしまうことを常に意識すべし。 特に、反直観的なmagnitude/directionにbiasが⽣じうることを注意すべし。
  33. Agenda • 16.1 The three instrumental conditions • 16.2 The

    usual IV estimand • 16.3 A fourth identifying condition: homogeneity • 16.4 An alternative fourth condition: monotonicity • 16.5 The three instrumental conditions revisited • 16.6 Instumental variable estimation versus other methods • Technical Point 16.1︓操作変数の三条件、formalな定義 • Fine Point 16.1︓観察データ分析における操作変数の候補 • Technical Point 16.2︓部分識別法による因果推論 • Technical Point 16.3︓Additive structural mean models and IV estimation • Technical Point 16.4︓Multiplicative structural mean models and IV estimation • Technical Point 16.5︓More general structural mean models • Fine Point 16.2︓弱操作変数の定義 • Technical Point 16.6︓単調性の過程と遵守者における効果
  34. Technical Point 16.1︓操作変数の三条件、formalな定義 1. 関連性条件︓Relevance condition, ZとAは独⽴ではない 2. 除外制約︓ exclusion

    restriction, 2 ",4 = 2 "!,4 = 2 4 , , , . この章では、population levelで成り⽴っていればいいとしている。( [2 ",4] = [2 "!,4] ) 3. ︓2 ",4 とZの間にmarginal exchangeabilityがあると⾔う。 除外制約と組み合わせることで、 2 4 とZが独⽴であると⾔える。 より強い(3)の条件として、 !,#; ∈ 0, 1 , ∈ 0,1 とが独⽴であると⾔うjoint exchangeabilityがあるが、Zがrandomized assignment であれば、両⽅の条件(3)は満たされる。 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z, A) ≠ 0) 2.ZはAを通して以外にYに影響を与えない(除外制約) 3.ZとYは common causesを持たない
  35. Fine Point 16.2︓弱操作変数の定義 1. The IV estimand([| = 1] −

    [| = 0]) is small. 2. Regress Z on AしたときのF統計量が10を下回る。 弱操作変数の定義 Smoking cessation の例では、1/2を両⽅満たす(risk difference = 6% & F-statistics = 0.8) 【Infinite sampleにおいて】 (2)(3)を満たさない場合、そのbiasを増幅させてしまう。 【Finite sampleにおいて】 2つ⽬のZ-A関連に関する統計的性質定義はZは有限標本においてもIV推定量にバイアスが含まれる。?精読予 定? 操作変数の3条件 1.ZとAの関連性の仮定(Cov(Z, A) ≠ 0) 2.ZはAを通して以外にYに影響を与えない(除外 制約) 3.ZとYは common causesを持たない
  36. Technical Point 16.2︓部分識別法による因果推論 Bounds推定とは︖ 1. Exchageabilityの仮定が成り⽴っていないとすると、 #$%| = 0 ,

    #$&| = 1 は、データから点推定出来 ない。 ( #$%| = 0 = #$%| = 1 , #$&| = 1 = #$&| = 0 といえない) 2. でも少なくとも、 #$%| = 0 , #$&| = 1 がどう⾔う値を取るかは分かる︕(別の仮定で狭められる) −1 ≤ #$%| = 0 , #$&| = 1 , ≤ 1 #$%| = 1 Pr = 1 − × Pr = 0 ≤ Pr #$% = 1 ≤ #$%| = 1 Pr = 1 + × Pr = 0 −1 ≤ !"#| = 0 , !"$| = 1 , ≤ 1より、何も仮定を置かないときのATEは.. − × Pr = 1 + #$&| = 0 × Pr = 0 ≤ Pr #$& = 1 ≤ × Pr = 1 + #$&| = 0 ,× Pr = 0 ≤ Pr #$% = 1 − Pr #$& = 1 ≤ ー ー 部分識別は、観察出来ない推定量に対する仮定を極⼒置かずに⺟数の識別を試みるアプローチ 1. 仮定を置かない分uninformative(推定したバウンドがNull を含む) 2. 線形モデル・同質性などの仮定を付与していくと、幅が狭まり、ある点に収束することが知られている 仮定を置かないとはどう⾔うことか︖
  37. Technical Point 16.2︓部分識別法による因果推論 操作変数が使えるときのATEのバウンド推定は..もっと狭まる。 操作変数を⽤いて #$% = 1 のboundsを求めてみる。 #$%

    = #$%| = = #$%| = 1, = [ = 1| = ] + #$%| = 0, = (1 − [ = 1| = ]) ≤ | = 1, = + × = 0| = これを全てのzで満たすから、 #$% = 1 < { = 1, = 1| = + × = 0| = } これをlower bounds・[#$&]のケースにも適⽤して、前ページのようにATEのバウンドを推定する。 操作変数Zが(ii), (iii)を満たしていれば、識別幅をNatural Boundsに抑えることができる。(Manski 1990) Y4 ⊥ 最初の項はconsistency ⼆項⽬は、upper bound of [!"#| = 0, ] Swanson et al(2018)によると、 Pr[X = 0|Z = 1] + Pr[X = 1|Z = 0] < min{Pr[X = 0|Z = 0] + Pr[X = 1|Z = 1], 1} が成り⽴つ時、 バウンド幅はPr[X = 0|Z = 1] + Pr[X = 1|Z = 0]となる。(natural bound)
  38. Technical Point 16.3︓ Additive structural mean models and IV estimation

    A,Zが2値変数のケースでSaturated, additive structural mean modelを考える。 4#$ − 4#% = 1, = % + $ これは、 − 4#% = 1, = % + $ … ∗ (! :処置群に対する平均因果効果) に書き換えることができる。 (ii)# ⊥ の条件から、E #$& = 1 = E[#$&| = 0] − & + % = 1 = [ − &| = 0] 仮に ≠ とすると、1つの式から , 2つのパラメタを推定することになり、推定できない。 % = 0と仮定することで下記のIV推定量が求められる、 & = = 1 − = 0 = 0 − [| = 0] ここまでの仮定で #$% − #$& = 1, = = #$% − #$& = 1 = & までは求められた。 ここで、 = [$ − $]というためには、 = $ − $ = でもある必要がある。 この仮定は、 = と同じく検証できない。 ここまで 操作変数の3仮定+ • Homogeneityの仮定②︓Zが Effect modifierではない。 • 制御群に対する平均因果効果も等 しいことを仮定しないと 標本集団全 体の平均因果効果にならない。 • (*)の式を変換して − (! + " ) = [#$!|] = [#$!]
  39. Technical Point 16.4︓ Multiplicative structural mean models and IV estimation

    [#$%| = 1, ] [#$&| = 1, ] = exp(& + % ) #$% − #$& = = 0 1 − exp & − 1 + [| = 0][][1 − exp −& ] ATU ATT exp −% = 1 − = 1 − [| = 0] = 1, = 1 = 1 − = 1, = 0 [| = 0] Henan and Robins(2006) のtheorem 4がこれにあたるので証明は割愛。 TBD
  40. Technical Point 16.5︓ More general structural mean models [#$%| =

    1, ] [#$&| = 1, ] = exp(& + % ) #$% − #$& = = 0 1 − exp & − 1 + [| = 0][][1 − exp −& ] ATU ATT exp −% = 1 − = 1 − [| = 0] = 1, = 1 = 1 − = 1, = 0 [| = 0] Henan and Robins(2006) のtheorem 4がこれにあたるので証明は割愛。 TBD
  41. Technical Point 16.6︓単調性の過程と遵守者における効果 遵守者の平均因果効果 E 4#$ − 4#% "#$ −

    "#% = 1 は単調性の仮定、つまり天の邪⻤(defiers)がい ない状況下において the usual IV estimandとなる(Imbens and Angrist(1994)) [| = 1] − [| = 0] [| = 1] − [| = 0] "#$ − "#% = "#$ − "#%|"#$ = 1, "#% = 1 Pr "#$ = 1, "#% = 1 + "#$ − "#%|"#$ = 0, "#% = 0 Pr "#$ = 0, "#% = 0 + "#$ − "#%|"#$ = 1, "#% = 0 Pr "#$ = 1, "#% = 0 + "#$ − "#%|"#$ = 0, "#% = 1 Pr "#$ = 0, "#% = 1 遵守者にとって、ZのYに対する効果はAのYに対する効果である。 E "#$ − "#% "#$ − "#% = 1 = E 4#$ − 4#% "#$ − "#% = 1 したがって、遵守者の平均因果効果は E 4#$ − 4#% "#$ − "#% = 1 = ["#$ − "#%] Pr "#$ = 1, "#% = 0 これは ∥ {4,", "; = 0,1; = 0,1} が成り⽴つ時、 5[6"#$76"#%] 89 :"#$#$,:"#%#% =5[6|;#$]75[6|;#%] 5[:|;#$]75[:|;#%] となる。 配置zにかかわらず受ける (ない)のでzero 単調性の仮定よりzero Proof 単調性の仮定・%, が独⽴と⾔う仮定(Zがランダム変数)から 1 − (%$" = 1, %$! = 1) − (%$" = 0, %$! = 0) (%$" = 1, %$! = 1) = [ = 1| = 0] %$" = 0, %$! = 0 = = 0 = 1 = 1 − = 1 = 1
  42. Fine Point 16.1 観察データ分析におけるIVの候補(経済学編) ⾃然実験 1. Angrist(1990) 1. ベトナム戦争における徴兵されることの所得への効果を推定 2.

    19歳の男性に誕⽣⽇ごとにrandomに抽選番号を付与→ある値よりも⼩さい抽選番号の⼈々に⼊隊資格が与えられた。 3. 健康上の理由から徴兵されなかった⼈々もいる(non-compliers) 4. ⼊隊がtreatment、所得をOutcomeに局所的平均因果効果を推定している。 2. Lundborg(2017) 1. ⼦供をもつこと(A)の⼥性のキャリア(Y︓昇進スピード・給与etc)への影響を分析 2. 体外受精処置の成功/失敗を操作変数としている。 RCT RCTで配置通りに処置が割り当てられなかった場合、利⽤される。(Angrist(2006)) • DVの被疑者の逮捕可否をrandomに割当→程度の酷い⼈たちは⾮遵守者として逮捕される。 Old ver IV • ⽣まれ⽉を操作変数に教育の賃⾦に与える効果を推定(Angrist and Kruger 1991) • ⽣まれ⽉によって教育⽉数が個⼈によって異なる。 • バウチャー制度の学業成績の差(Angrist et al. 2002) • 私⽴中学への学費を半額賄えるクーポンを「くじ引き」で配布 • 海での降⽔量・嵐→価格変動→需要関数(Angrist et al. 2000) • Evans and Ringel(1999):タバコ税を操作変数に妊婦の喫煙量が新⽣児の体重に与える影響を推定
  43. Fine Point 16.1 観察データ分析におけるIVの候補(疫学編) Generic Factors メンデルの独⽴の法則 遺伝的変異 ex:ALDH2 Alcohol

    Intake 処⽅する医師の Preference Risk coronary heart disease Gastrointestinal bleeding Physicianʼs prescribing preference for drug class Last prescription issued by physician before current prescription Nonsteroidal anti- inflammatory drugs " Z A Y Z A Y Access 次ページにて記載
  44. Fine Point 16.1 観察データ分析におけるIVの候補(疫学編) Price of the treatment Access 禁煙の意思決定

    体重増減 テキストの例もAccessibilityタイプのIVと⾔える。 Calendar period︓時間を通じて利⽤可否が変化することをIVとして利⽤ →流⾏りの処置が変わってくるケースがある(Ertefaie et al (2017)) (他の共変量も変化してくるので、IVの仮定を満たしていない可能性が⾼い。) 処置を⾏う施設までの距離・移動時間は、Aのみに影響を与える(施設の場所 が内⽣的に決まる場合はだめ*) Baiocchi et al(2010) (*) 鉄道開設による各地域間の貿易量の変化を⾒たい時に、 政策決 定者の期待が⾼い地域のみ鉄道開設がされていると、Zのランダム性が期 待できない。 ⾼⽔準の新⽣児集中治療室との 地理的近接性 サービス⽔準の異なる新⽣児 集中治療室での 出産 新⽣児のmortality
  45. おまけ︓経済学topジャーナルで操作変数法はどれくらい使われているか Brodeur(2019)はmethodごとにp-hackingが起きているかどうかを検証するために、2015年にtop25経済学誌に掲 載された論⽂を調査した。DID, IV法がp-hackedされている可能性を⽰唆している。 IV法を利⽤した研究は、2015年のtop25を⾒る限りRCTよりも 多い印象がある。

  46. Reference(TBD) • Angrist(2006) https://link.springer.com/article/10.1007/s11292-005-5126-x