Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Random variability (Causal inference: What if, ...

Shuntaro Sato
November 18, 2020

Random variability (Causal inference: What if, Chapter 10)

Keywords: 因果推論, Unbiasness(不偏性), Consistency(一致性), The curse of dimensionality(次元の呪い)

Shuntaro Sato

November 18, 2020
Tweet

More Decks by Shuntaro Sato

Other Decks in Science

Transcript

  1. Consistencyはサンプルサイズが大きくなると推定値(Estimator)が真値(Estimand)に漸近的に近づく性質。 母数を の推定量を とする。任意の に対して が成立するとき,推定量 を一致推定量(consisent estimator)という。これは 推定量 の期待値が

    に確率収束すること( ) 分散が に確率収束すること( ) とも言い換えられる。 An estimator is only unbiased if it is uniformly asymptotic normal and unbiased (UANU), as only UANU estimators can center valid standard Wald intervals for under the model M . θ ̂ θ ϵ > lim n→∞ Pr{| ̂ θn − θ| > ϵ} = 0 ̂ θ ̂ θ θ lim n→∞ E[ ̂ θn ] = θ 0 lim n→∞ V[ ̂ θn ] = 0 θ(P) T10.1: Bias and Consistency in Statistical Inference 5
  2. 1. Identification versus estimation (識別と測定) 2. Estimation of causal effects

    (因果効果の推定) 3. The myth of the super-population (超母集団の神話) 4. The conditionality “principle” (条件付きの原則) 5. The curse of dimensionality (層別分化の呪い?) 目次 7
  3. Super population Population (Sample) Estimand 知りたい値 真値 Sampling Estimator 計算するルール

    推定量 Estimate 計算して出てきた数値 推定値 この章で問題にするのは… 10
  4. 二値変数(二項分布)の例 母集団のパラメータ ,推定値 。 nがある程度大きい時,二項分布は正規分布に近似できることが知られている。ここから,Yを標準化したら標準正規分布に従 う。 推定値 から, これが標準正規分布に従う。標準正規分布のの95%信頼区間は±1.96だから から,

    nが十分に大きい時 であることを使って計算 テキストの事例では, なので,信頼区間は,0.27から0.81 = Pr[ = | = ] ̂ = ̂ Pr[ = | = ] () = , () = ( − ) = − ( − ) ̂ p = Y/n = − ( − ) = / / × − ( − ) = / − ( − )/ = ̂ − ( − )/ − . ≤ ̂ − ( − )/ ≤ . ̂ − . × ( − )/ ≤ ≤ ̂ + . × ( − )/ ̂ ( − ̂ )/ ⟶ ( − )/ ̂ = / 13
  5. Super-populationにおけるExchangeabilityは満たされている = ここから,super-populationにおける Causal risk difference = Associational risk difference

    = ランダムサンプルなので, は,super-populationの確率である の不偏推定量(unbiased estimator) = これらから本来比較したい母集団の介入効果の検証( と いう帰無仮説の検定)は,サンプルにおける介入の有無の比較 ( )によって可能に Pr[ = ] Pr[ = | = ] Pr[= = ] − Pr[= = ] Pr[ = | = ] − Pr[ = | = ] ̂ Pr[ = | = ] Pr[ = | = ] ( ̂ Pr[ = | = ] − ̂ Pr[ = | = ]) Pr[ = | = ] − Pr[ = | = ] Pr[= = ] = Pr[= = ] ̂ Pr[ = | = ] = ̂ Pr[ = | = ] 21
  6. TABLE 10.1 Y = 1 Y = 0 A =

    1 24 96 A = 0 42 78 Y: Ξ΢τΧϜɻ1೥Ͱࢮ͵(Y=1)͔Ͳ͏͔ A:ॲஔɻ͢Δ(A = 1)͔Ͳ͏͔ 29 (exchangeable)だから,こ のサンプルから,super-population における効果を推定できる。 ここから,推定値-0.15,信頼区間 [-0.26,-0.04]を計算して,論文とし て発表したとする ⊥ ⊥
  7. TABLE 10.2 L = 1 Y = 1 Y =

    0 A = 1 4 76 A = 0 2 38 L = 0 Y = 1 Y = 0 A = 1 20 20 A = 0 40 40 Y: Ξ΢τΧϜɻ1೥Ͱࢮ͵(Y=1)͔Ͳ͏͔ A:ॲஔɻ͢Δ(A = 1)͔Ͳ͏͔ L: ͦͷଞͷ৚݅ɻλόίٵ͏(L = 1)͔Ͳ͏͔ 30 後になって喫煙するかどうかについての情報を手に 入れた。 喫煙の有無で場合わけすると, 喫煙者と非喫煙者は同数 喫煙者と非喫煙者で,処置を受ける割合に大き な違い 喫煙の調整をした結果, 喫煙者における効果は0 非喫煙者における効果も0 Pr[ = | = , = ] − Pr[ = | = , = ] = Pr[ = | = , = ] − Pr[ = | = , = ] =
  8. 0 .1 .2 .3 .4 .5 Fitted values 0 .2

    .4 .6 .8 1 a Full L=0 L=1 31
  9. Consistencyはサンプルサイズが大きくなると推定値(Estimator)が真値(Estimand)に漸近的に近づく性質。 母数を の推定量を とする。任意の に対して が成立するとき,推定量 を一致推定量(consisent estimator)という。これは 推定量 の期待値が

    に確率収束すること( ) 分散が に確率収束すること( ) とも言い換えられる。 An estimator is only unbiased if it is uniformly asymptotic normal and unbiased (UANU), as only UANU estimators can center valid standard Wald intervals for under the model M . θ ̂ θ ϵ > lim n→∞ Pr{| ̂ θn − θ| > ϵ} = 0 ̂ θ ̂ θ θ lim n→∞ E[ ̂ θn ] = θ 0 lim n→∞ V[ ̂ θn ] = 0 θ(P) T10.1: Bias and Consistency in Statistical Inference 39
  10. 補助統計量となるいかなる統計量も条件づけて推定するのが良い! Y,A,L , は, にかかわらず一定。 推定したいのは,層別のリスクの差 , , , は,それぞれ誤差分散のようなもの。

    AとLは に個々に関係あるけど,結合密度は に影響を与えないような時,A とLは補助統計量(exactly ancillary for the parameter of interest)となる。 L = {0,1} Ya ⊥ ⊥ A|L sRD = Pr(Y = 1|L = l, A = 1) − Pr(Y = 1|L = l, A = 0) L n ∏ i=1 f(Yi |Li , Ai ; sRD, p0 ) × f(Ai |Li ; α) × f(Li ; ρ) p0 = (p01 , p02 ) p0l = Pr(Y = 1|L = l, A = 0) α ρ sRD f(Yi |Li , Ai ; sRD, p0 ) T10.2: A Formal Statement of the Conditionality Principle 40 Pr(Y ∩ A ∩ L) = Pr(Y ∩ (A ∩ L)) = Pr(Y|(A ∩ L)) × Pr((A ∩ L) = Pr(Y|(A ∩ L)) × Pr(A|L) × Pr(L)
  11. は, によって異なることが知られている。この時,リスクの差は と に依存 条件なくランダム化した実験では は母集団のA-Lのオッズ比 はサンプルからの推定値 標準偏差 で割った は,大きなサンプルの時標準正規分布に従う。

    →偏差値 sRDi L RDstd = ∑ l [Pr(Y = 1|L = l, A = 1; v) − Pr(Y = 1|L = l, A = 0; v)]f(l; ρ) v = sRDl, po,l ; l = 0,1 ρ RDstd = RD = Pr(Y = 1|A = 1) − Pr(Y = 1|A = 0) ˜ S = ̂ ORAL − ORAL ORAL ̂ ORAL ̂ se ( ˜ S) ̂ S = ˜ S/ ̂ se ( ˜ S) 41 T10.3: Approximate Ancillary
  12. が既知の時, は漸近的補助統計量(approximate ancillary statistic). データから計算可能で 真値(Estimand)とは関係のないαの関数で, はαにのみ依存するのに対して, はαに依存しない で条件づけると は不偏(unbiased)になる

    連続性の原則(continuity principle)と,条件づけ(conditionality)の原則を 前提とすると,漸近的補助統計量によって調整がなされるべき ̂ ORAL ̂ S f(Ai |Li ; α) f(Yi |Li , Ai ; sRD, p0 )f(Li ; ρ) ̂ S RDstd
  13. は,サンプルを使って最尤法で推定した値( )だとする。 調整なしの推定値は 本文の中で, は,unconditionally inefficient で,conditionally biased であるとした。 なぜ?

    RDstd = ∑ l [Pr(Y = 1|L = l, A = 1; v) − Pr(Y = 1|L = l, A = 0; v)]f(l; ρ) ̂ RDMLE ̂ RDUN = ̂ Pr(Y = 1|A = 1) − ̂ Pr(Y = 1|A = 0) ̂ RDUN T10.4: Comparison Between Adjusted and Unadjusted Estimators 43
  14. Robins and Morgenstern (1987)は を示した。 未調整の推定値は, の時,常にinefficient. さらに, を示した。 未調整の推定値は,inefficientの時,biased

    aVar( ̂ RDMLE ) = aVar( ̂ RDUN ) − [aCov( ̂ S, ̂ RDUN )]2 aCov( ̂ S, ̂ RDUN ) ≠ 0 aE[ ̂ RDUN | ̂ S] − RDstd = aCov( ̂ S, ̂ RDUN ) ̂ S となるのは, の時のみ. そうでない場合, は より好ましい aCov( ̂ S, ̂ RDUN ) = 0 L ⊥ ⊥ Y|A ̂ RDMLE ̂ RDUN
  15. Table 10.2のL=1における分散を計算する時, と ならば, 普通前者を選ぶ。 これは,暗黙的にconditionality principleに従ってい る,ということと同じ。 ̂ Vobs

    1 = 4 80 76 80 80 + 2 40 38 40 40 = 1.78 × 10−3 ̂ Vexp 1 = 4 80 76 80 60 + 2 40 38 40 60 = 1.58 × 10−3 T10.5: Most Researchers Intuitively Follow the Extended Conditionality Principle 45 L = 1 Y = 1 Y = 0 A = 1 4 76 A = 0 2 38
  16. に対する の効果を知りたい。 最小二乗法*を使って推定する。 Y A Yi = β0 + β1

    Ai + ui ̂ β1 = ∑ (Ai − ¯ A)Yi (Ai − ¯ A)2 = SAY SAA ̂ β0 = ¯ Y − ̂ β1 ¯ A 前提条件 49 uに関する仮定 因果関係があると解釈できるのは, (Yと関係するA以外の要因が,Aと関係 ない) 時 ¯ A = 1 n ∑ Ai E[ui ] = 0 V(ui ) = σ2 E[u|A] = 0 *テキストでは最尤法を使ってますが,右の条件に従うと同値になるはずです。
  17. 真のモデル 推定するモデル 推定するモデルの推定値に真のモデルを代 入すると… 期待値をとると の部分がLを入れなかったことに よって生じる推定値のズレ(バイアス) でない限り不偏性が保たれないの で,間違った推定値が計算される。一致性 もない。

    Yi = β0 + β1 Ai + β2 Li + ui Yi = α0 + α1 Ai + vi ̂ α1 = SAY SAA = ∑ (Ai − ¯ A)(Yi − ¯ Y) ∑ (Ai − ¯ A)2 = ∑ wAi Yi = ∑ wAi (β0 + β1 Ai + β2 Li + ui ) = β1 + β2 SAL SAA + ∑ w2i ui E(α1 ) = β1 + β2 SAL SAA β2 SAL SAA SAL = 0 51 SAY = ∑ (Ai − ¯ A)(Yi − ¯ Y) SAA = ∑ (Ai − ¯ A)2 wAi = Ai − ¯ A ∑ (Ai − ¯ A)
  18. 真のモデルが 推定したのが 推定値 に真のモデルを代入 期待をとると 期待値は変わらない。不偏性は保たれ る。 Yi = βo

    + β1 Ai + ϵi Yi = αo + α1 Ai + α2 L + vi ̂ α1 ̂ α1 = SLL SAY − SAL SLY SAA SLL − S2 AL = ∑ hi Yi = ∑ hi (β0 + β1 Ai + ϵi ) = β0 ∑ hi + β1 ∑ hi Ai + ∑ hi ϵi = β1 + ∑ hi ϵi E( ̂ α1 ) = β1 + ∑ hi E(ϵi ) = β1 53
  19. でも,分散は大きくなる 間違えたモデルの分散は 真のモデルでは ここで から 変数の入れすぎは,分散が大き くなる(効率性が落ちる)。 V( ̂ α1

    ) = ∑ h2 i E(ϵ2 i ) = σ2 SLL SAA SLL − S2 AL V( ̂ β1 ) = ∑ w2 Ai V(Yi ) = σ2 1 SAA SLL SAA SLL − S2 AL = 1 SAA − S2 AL SLL SAA > SAA − S2 AL SLL 54
  20. 組織コミットメント パフォーマンス Allen and Meyer(1996) の尺度 個人の月間売上 抽象的 (概念) 具体的

    (データ) 操作化 操作化 理論的関係 統計的検証 構成概念妥当性 独立変数 従属変数 外的妥当性 内的妥当性 経験・年齢 統計的結論 妥当性 コントロール変数 Libby et al. (2002)を参考に作成しました。 Libby, R., R. Bloomfield, and M. W. Nelson. 2002. Experimental research in financial accounting. Accounting, Organizations and Society 27 (8): 775–810. 55 参考:会計学でよく使われる研究デザインと妥当性の整理方法
  21. 木村俊一・古澄英男・鈴川晶夫. 2003. 『確率と統計 : 基礎と応用』. 朝倉書店. 東京大学教養学部統計学教室. 1991. 『基礎統計学』. 東京大学出版会. Libby,

    R., R. Bloomfield, and M. W. Nelson. 2002. Experimental research in financial accounting. Accounting, Organizations and Society 27 (8): 775–810. 富山大学計量経済学講義資料 唐渡広志先生 http://www3.u-toyama.ac.jp/ kkarato/2017/econometrics/handout/Econometrics-2017-23-1219.pdf [2020/07/10アクセス] 参考文献 56