Slide 1

Slide 1 text

2020/07/19 @butano_hito Chapter10 Random Variability What if ษڧձ 1

Slide 2

Slide 2 text

これまでの章では,バイアスについて勉強してきた Confounding Selection Measurement この章では,今まで(十分なサンプルサイズが確保されていると言う) 仮定によりその影響を排除していたサンプルサイズの影響,識別問題 (Identification problems)について扱う。 母集団からサンプリングしたデータを用いて分析を行うことによる確率 的な変動(Random variability)に関する話 概要 2

Slide 3

Slide 3 text

前提 3

Slide 4

Slide 4 text

不偏性(Unbiasness) 推定値の期待値が真の値と同じになる サンプルサイズに依存しない 不偏性が担保されないと,サンプルをいくら増やしても真値(母集団のパラメータ) が推定できない 一致性(Consistency) :第3章とかで出てくる一貫性とは別 推定値がある値に確率収束する サンプルサイズの大きさが重要 サンプルサイズnが大きくなるに従って、推定量が、母集団の真の値に近づいていく 前提:(多分ここで扱っている話) 4

Slide 5

Slide 5 text

Consistencyはサンプルサイズが大きくなると推定値(Estimator)が真値(Estimand)に漸近的に近づく性質。 母数を の推定量を とする。任意の に対して が成立するとき,推定量 を一致推定量(consisent estimator)という。これは 推定量 の期待値が に確率収束すること( ) 分散が に確率収束すること( ) とも言い換えられる。 An estimator is only unbiased if it is uniformly asymptotic normal and unbiased (UANU), as only UANU estimators can center valid standard Wald intervals for under the model M . θ ̂ θ ϵ > lim n→∞ Pr{| ̂ θn − θ| > ϵ} = 0 ̂ θ ̂ θ θ lim n→∞ E[ ̂ θn ] = θ 0 lim n→∞ V[ ̂ θn ] = 0 θ(P) T10.1: Bias and Consistency in Statistical Inference 5

Slide 6

Slide 6 text

Super population: 母集団 Population (Sample): 標本 超母集団モデルという確率論の議論があるようですが,Popuationと Sampleを互換的に使用している?この章の記述を見る限り,Super populationは,母集団と標本の関係における母集団を意味しているよ うに思います。 用語 6

Slide 7

Slide 7 text

1. Identification versus estimation (識別と測定) 2. Estimation of causal effects (因果効果の推定) 3. The myth of the super-population (超母集団の神話) 4. The conditionality “principle” (条件付きの原則) 5. The curse of dimensionality (層別分化の呪い?) 目次 7

Slide 8

Slide 8 text

10.1 Identification Versus Estimation (識別と測定) 8

Slide 9

Slide 9 text

Exchangeability Positivity Consistency 処置あり 処置なし これまでの話 9 measurement selection confounding

Slide 10

Slide 10 text

Super population Population (Sample) Estimand 知りたい値 真値 Sampling Estimator 計算するルール 推定量 Estimate 計算して出てきた数値 推定値 この章で問題にするのは… 10

Slide 11

Slide 11 text

一致性が満たされていたら,サンプルサイズの増加に伴い分散が0に。 ある1つの数値に収束する ただし,サンプルサイズは無限大ではないので,推定値は確率変数。 推定値がある確率で特定の範囲に収まる,その範囲を信頼区間という。 狭ければ狭いほどある一定の点に近づくので嬉しい。 サンプルサイズ(The size of the study population)が大きい(小さい)ほ ど,信頼区間は狭く(広く)。 信頼区間(Confidence Interval: CI) 11

Slide 12

Slide 12 text

サンプルが母集団からの無作為抽出であるという前提のもと,標準誤差 (se)を計算する ± se × 1.96 で計算する。 テキストの事例では,信頼区間は0.27から0.81 詳しくは次のページ 信頼区間の計算 12

Slide 13

Slide 13 text

二値変数(二項分布)の例 母集団のパラメータ ,推定値 。 nがある程度大きい時,二項分布は正規分布に近似できることが知られている。ここから,Yを標準化したら標準正規分布に従 う。 推定値 から, これが標準正規分布に従う。標準正規分布のの95%信頼区間は±1.96だから から, nが十分に大きい時 であることを使って計算 テキストの事例では, なので,信頼区間は,0.27から0.81 = Pr[ = | = ] ̂ = ̂ Pr[ = | = ] () = , () = ( − ) = − ( − ) ̂ p = Y/n = − ( − ) = / / × − ( − ) = / − ( − )/ = ̂ − ( − )/ − . ≤ ̂ − ( − )/ ≤ . ̂ − . × ( − )/ ≤ ≤ ̂ + . × ( − )/ ̂ ( − ̂ )/ ⟶ ( − )/ ̂ = / 13

Slide 14

Slide 14 text

母集団からのサンプリングを繰り返し行った場合,95%はこの範囲の中に入る。 95%真のパラメータがこの範囲の中に入っている。 特定の研究における95%信頼区間は,「95%の確率でestimand(母集団のパラ メータ)がこの範囲の中に入る」ということを意味しているわけではない。 estimandは固定された値(確率変数ではない)だから。 信頼区間は,頻度論的な解釈しか与えない。 信頼区間の数値(95%)は,複数の研究(もしくは仮想上の研究の繰り返し)に おいて,未知の母集団の数値が入る頻度を表している。 三重大学奥村先生の説明が丁寧 信頼区間の意味 14

Slide 15

Slide 15 text

Small-sample confidence intervalは,Exact confidence intervalとも言われ る。 漸近理論を使わない。テキストの例では,サンプルサイズが大きい時 に二項分布が正規分布に近似できるということを使って信頼区間を計 算した。サンプルが小さい時にはこの近似が成り立たないので,別の 方法で計算する。 フィッシャーの正確検定 テキストでは,Large-sampleの場合を基本とする。 Small SampleとLarge Sample 15

Slide 16

Slide 16 text

大標本で有効な95%の信頼区間が,少なくとも95%の頻度で真のパラ メータ値をカバーすることが保証されているサンプルサイズが存在する 場合、その区間はuniformであるか、またはhonestである,という。 どれぐらいのサンプルサイズがあると,これが達成できるのかは,決め るのが難しい。 ຊͷதͰ͸honestを想定して議論している。 F10.1: Honest Confidence Intervals. 16

Slide 17

Slide 17 text

信頼区間は,Random Variabilityを表す標準誤差の関数 サンプルサイズを大きくすると,Random Variabilityは小さくなる。 (バイアスの大きさはわからないけど)標準誤差が小さくなったらuncertaintyが小 さいと錯覚する? Uncertaintyを定量的に評価するquantitative bias analysisという分野も。 F10.2: Uncertainty From Systematic Biases 17 Uncertainty Bias Random Variability

Slide 18

Slide 18 text

推定量が信頼区間の真ん中に ある時,推定量にバイアスが ないと考える。 逆に何らかのsystematic biasesがある時,推定量は信 頼区間の真ん中に位置しな い。 バイアスと信頼区間 18 0 .1 .2 .3 .4 y -4 -2 0 2 4 x ਅͷ෼෍ όΠΞεͷ͋Δ෼෍

Slide 19

Slide 19 text

10.2 Estimation of Causal Effects (因果効果の推定) 19

Slide 20

Slide 20 text

無限のsuper-populationからの20名の無作為抽出 A = 1(Ҡ২͢Δ)もしくはA = 0(Ҡ২͠ͳ͍)に無作為に割り当てられる。 Y = 1(死ぬ)もしくはY = 0(死なない) 事例(心臓移植) 20

Slide 21

Slide 21 text

Super-populationにおけるExchangeabilityは満たされている = ここから,super-populationにおける Causal risk difference = Associational risk difference = ランダムサンプルなので, は,super-populationの確率である の不偏推定量(unbiased estimator) = これらから本来比較したい母集団の介入効果の検証( と いう帰無仮説の検定)は,サンプルにおける介入の有無の比較 ( )によって可能に Pr[ = ] Pr[ = | = ] Pr[= = ] − Pr[= = ] Pr[ = | = ] − Pr[ = | = ] ̂ Pr[ = | = ] Pr[ = | = ] ( ̂ Pr[ = | = ] − ̂ Pr[ = | = ]) Pr[ = | = ] − Pr[ = | = ] Pr[= = ] = Pr[= = ] ̂ Pr[ = | = ] = ̂ Pr[ = | = ] 21

Slide 22

Slide 22 text

20名の個人が,心臓移植 もしくはその他 に割り振られる。 それぞれの個人は,ランダム化する際に良いもしくは悪いという経過の 予測がなされている。 もし,経過予測が「悪い」とされた人の比率が, と で同じな ら,exchangeabilityが成り立つと言える。 「悪い」人が に2/13, に3/7になることもあり得る。 (もし,サンプルがもっともっと大きくなると,この割合の違いは減って いくことが期待される。) = = = = = = 22

Slide 23

Slide 23 text

こんな時どうする? (super-populationではなく)ランダム化されたサンプルのみに当ては まる知見として推論する super-populationの推論を試みる 実際知りたいのは,サンプル内の効果ではなく,一般化されたsuper- populationに関する知識。 23

Slide 24

Slide 24 text

10.3 The Myth of the Super-Population (超母集団の神話) 24

Slide 25

Slide 25 text

設定 pの信頼区間は,以下のように求める ただし,これが適切なのは, が二項分布(binomial sampling distribution)に従う時だけ。 ̂ Pr[ = | = ] = ̂ = / Pr[ = | = ] = ̂ ± . ̂ ( − ̂ ) = / ± . /(/) ̂

Slide 26

Slide 26 text

サンプルとして二項分布? 母集団から13のサンプルサイズの サンプリングを繰り返した時の結 果の分布 個人に確率があり,個々人がpの確率 を持つ? 個々人は同じpを持つ。 二項分布に従うとは? 26 7/13 6/13 8/13 … 7 13 7 13 7 13 7 13 7 13

Slide 27

Slide 27 text

౷ܭతʹγϯϓϧͳํ๏ͰਪఆͰ͖Δ ҰൠԽʹͭͳ͕Δ(֎తଥ౰ੑ) 母集団からのサンプリングを想定する理由 27

Slide 28

Slide 28 text

10.4 The Conditionality “Principle” (条件付きの原則) 28

Slide 29

Slide 29 text

TABLE 10.1 Y = 1 Y = 0 A = 1 24 96 A = 0 42 78 Y: Ξ΢τΧϜɻ1೥Ͱࢮ͵(Y=1)͔Ͳ͏͔ A:ॲஔɻ͢Δ(A = 1)͔Ͳ͏͔ 29 (exchangeable)だから,こ のサンプルから,super-population における効果を推定できる。 ここから,推定値-0.15,信頼区間 [-0.26,-0.04]を計算して,論文とし て発表したとする ⊥ ⊥

Slide 30

Slide 30 text

TABLE 10.2 L = 1 Y = 1 Y = 0 A = 1 4 76 A = 0 2 38 L = 0 Y = 1 Y = 0 A = 1 20 20 A = 0 40 40 Y: Ξ΢τΧϜɻ1೥Ͱࢮ͵(Y=1)͔Ͳ͏͔ A:ॲஔɻ͢Δ(A = 1)͔Ͳ͏͔ L: ͦͷଞͷ৚݅ɻλόίٵ͏(L = 1)͔Ͳ͏͔ 30 後になって喫煙するかどうかについての情報を手に 入れた。 喫煙の有無で場合わけすると, 喫煙者と非喫煙者は同数 喫煙者と非喫煙者で,処置を受ける割合に大き な違い 喫煙の調整をした結果, 喫煙者における効果は0 非喫煙者における効果も0 Pr[ = | = , = ] − Pr[ = | = , = ] = Pr[ = | = , = ] − Pr[ = | = , = ] =

Slide 31

Slide 31 text

0 .1 .2 .3 .4 .5 Fitted values 0 .2 .4 .6 .8 1 a Full L=0 L=1 31

Slide 32

Slide 32 text

ランダム割付は,完全なexchangeabilityを保証しているわけではない Exhangeabilityからの乖離がシステマティックなバイアスではなく,ラン ダムなばらつきによるっていうことを保証するだけ。 ランダム割付=Exchangeability? 32

Slide 33

Slide 33 text

じゃあどうする? 33 測定されていない他の要因(U)も喫煙と同様個々ではバランスが取れ てないかもしれなくて,その他の要因のインバランスが喫煙(L)の効 果をキャンセルアウトするのでは? LとAの強い関係性が交絡をもたらす。 喫煙(L)のレベル内で,小さいランダム化がなされていると想定した ら,U-Aの関係は,Lの条件内で成立するのでは? A B

Slide 34

Slide 34 text

変数の欠落 →バイアスをもたらす。 過少定式化,Omitted variable bias 不偏性も一致性も無くなる 変数の過剰投入 →効率性は落ちるがバイアスはかからない。 過剰定式化 不偏性は無くならないが,有効性が落ちる(信頼区間が広くなる) Bさんが正解 34

Slide 35

Slide 35 text

10.5 The Curse of Dimensionality (૚ผ෼Խͷढ͍) 35

Slide 36

Slide 36 text

コントロールする要因が多すぎたら? 36 A B 性別 60歳 2通り 2×2=4通り 2×2×2=8通り

Slide 37

Slide 37 text

Chapter 18で出てくるそうです。 メモ 自由度をあまり減少させずに,個別効果を取り除きたい? パネルデータの形式になっているならランダム効果使う? HLM? どうするかは難しい問題 37

Slide 38

Slide 38 text

その他

Slide 39

Slide 39 text

Consistencyはサンプルサイズが大きくなると推定値(Estimator)が真値(Estimand)に漸近的に近づく性質。 母数を の推定量を とする。任意の に対して が成立するとき,推定量 を一致推定量(consisent estimator)という。これは 推定量 の期待値が に確率収束すること( ) 分散が に確率収束すること( ) とも言い換えられる。 An estimator is only unbiased if it is uniformly asymptotic normal and unbiased (UANU), as only UANU estimators can center valid standard Wald intervals for under the model M . θ ̂ θ ϵ > lim n→∞ Pr{| ̂ θn − θ| > ϵ} = 0 ̂ θ ̂ θ θ lim n→∞ E[ ̂ θn ] = θ 0 lim n→∞ V[ ̂ θn ] = 0 θ(P) T10.1: Bias and Consistency in Statistical Inference 39

Slide 40

Slide 40 text

補助統計量となるいかなる統計量も条件づけて推定するのが良い! Y,A,L , は, にかかわらず一定。 推定したいのは,層別のリスクの差 , , , は,それぞれ誤差分散のようなもの。 AとLは に個々に関係あるけど,結合密度は に影響を与えないような時,A とLは補助統計量(exactly ancillary for the parameter of interest)となる。 L = {0,1} Ya ⊥ ⊥ A|L sRD = Pr(Y = 1|L = l, A = 1) − Pr(Y = 1|L = l, A = 0) L n ∏ i=1 f(Yi |Li , Ai ; sRD, p0 ) × f(Ai |Li ; α) × f(Li ; ρ) p0 = (p01 , p02 ) p0l = Pr(Y = 1|L = l, A = 0) α ρ sRD f(Yi |Li , Ai ; sRD, p0 ) T10.2: A Formal Statement of the Conditionality Principle 40 Pr(Y ∩ A ∩ L) = Pr(Y ∩ (A ∩ L)) = Pr(Y|(A ∩ L)) × Pr((A ∩ L) = Pr(Y|(A ∩ L)) × Pr(A|L) × Pr(L)

Slide 41

Slide 41 text

は, によって異なることが知られている。この時,リスクの差は と に依存 条件なくランダム化した実験では は母集団のA-Lのオッズ比 はサンプルからの推定値 標準偏差 で割った は,大きなサンプルの時標準正規分布に従う。 →偏差値 sRDi L RDstd = ∑ l [Pr(Y = 1|L = l, A = 1; v) − Pr(Y = 1|L = l, A = 0; v)]f(l; ρ) v = sRDl, po,l ; l = 0,1 ρ RDstd = RD = Pr(Y = 1|A = 1) − Pr(Y = 1|A = 0) ˜ S = ̂ ORAL − ORAL ORAL ̂ ORAL ̂ se ( ˜ S) ̂ S = ˜ S/ ̂ se ( ˜ S) 41 T10.3: Approximate Ancillary

Slide 42

Slide 42 text

が既知の時, は漸近的補助統計量(approximate ancillary statistic). データから計算可能で 真値(Estimand)とは関係のないαの関数で, はαにのみ依存するのに対して, はαに依存しない で条件づけると は不偏(unbiased)になる 連続性の原則(continuity principle)と,条件づけ(conditionality)の原則を 前提とすると,漸近的補助統計量によって調整がなされるべき ̂ ORAL ̂ S f(Ai |Li ; α) f(Yi |Li , Ai ; sRD, p0 )f(Li ; ρ) ̂ S RDstd

Slide 43

Slide 43 text

は,サンプルを使って最尤法で推定した値( )だとする。 調整なしの推定値は 本文の中で, は,unconditionally inefficient で,conditionally biased であるとした。 なぜ? RDstd = ∑ l [Pr(Y = 1|L = l, A = 1; v) − Pr(Y = 1|L = l, A = 0; v)]f(l; ρ) ̂ RDMLE ̂ RDUN = ̂ Pr(Y = 1|A = 1) − ̂ Pr(Y = 1|A = 0) ̂ RDUN T10.4: Comparison Between Adjusted and Unadjusted Estimators 43

Slide 44

Slide 44 text

Robins and Morgenstern (1987)は を示した。 未調整の推定値は, の時,常にinefficient. さらに, を示した。 未調整の推定値は,inefficientの時,biased aVar( ̂ RDMLE ) = aVar( ̂ RDUN ) − [aCov( ̂ S, ̂ RDUN )]2 aCov( ̂ S, ̂ RDUN ) ≠ 0 aE[ ̂ RDUN | ̂ S] − RDstd = aCov( ̂ S, ̂ RDUN ) ̂ S となるのは, の時のみ. そうでない場合, は より好ましい aCov( ̂ S, ̂ RDUN ) = 0 L ⊥ ⊥ Y|A ̂ RDMLE ̂ RDUN

Slide 45

Slide 45 text

Table 10.2のL=1における分散を計算する時, と ならば, 普通前者を選ぶ。 これは,暗黙的にconditionality principleに従ってい る,ということと同じ。 ̂ Vobs 1 = 4 80 76 80 80 + 2 40 38 40 40 = 1.78 × 10−3 ̂ Vexp 1 = 4 80 76 80 60 + 2 40 38 40 60 = 1.58 × 10−3 T10.5: Most Researchers Intuitively Follow the Extended Conditionality Principle 45 L = 1 Y = 1 Y = 0 A = 1 4 76 A = 0 2 38

Slide 46

Slide 46 text

階層Lが多すぎると,良い推定ができなくなる。 各条件のサンプルサイズが小さくなる。 標準誤差が上がる。 ランダム化比較実験なら,沢山のLがあっても,調整なしでバイアスのな い推定が可能。 無条件にバイアスがなく、かつ調整なしの推定値よりもEfficientな推定値 を構築できないか? 18章(18 Variable selection for causal inference)でやるそうです。 T10.6: Can the Curse of Dimensionality Be Reversed? 46

Slide 47

Slide 47 text

TECHNICAL POINT について

Slide 48

Slide 48 text

テクニカルポイント2-5で言いたいこと 48 LがY,Aと相関している時,Lを調整しないとよろしくない 推定結果にバイアスがかかる LがY, Aと相関していない時,Lを調整したら 推定値の効率性が落ちる バイアスはかからない 真のモデルがわからない場合,入れる方がまし

Slide 49

Slide 49 text

に対する の効果を知りたい。 最小二乗法*を使って推定する。 Y A Yi = β0 + β1 Ai + ui ̂ β1 = ∑ (Ai − ¯ A)Yi (Ai − ¯ A)2 = SAY SAA ̂ β0 = ¯ Y − ̂ β1 ¯ A 前提条件 49 uに関する仮定 因果関係があると解釈できるのは, (Yと関係するA以外の要因が,Aと関係 ない) 時 ¯ A = 1 n ∑ Ai E[ui ] = 0 V(ui ) = σ2 E[u|A] = 0 *テキストでは最尤法を使ってますが,右の条件に従うと同値になるはずです。

Slide 50

Slide 50 text

本当は必要なLを入れなかったら? 50

Slide 51

Slide 51 text

真のモデル 推定するモデル 推定するモデルの推定値に真のモデルを代 入すると… 期待値をとると の部分がLを入れなかったことに よって生じる推定値のズレ(バイアス) でない限り不偏性が保たれないの で,間違った推定値が計算される。一致性 もない。 Yi = β0 + β1 Ai + β2 Li + ui Yi = α0 + α1 Ai + vi ̂ α1 = SAY SAA = ∑ (Ai − ¯ A)(Yi − ¯ Y) ∑ (Ai − ¯ A)2 = ∑ wAi Yi = ∑ wAi (β0 + β1 Ai + β2 Li + ui ) = β1 + β2 SAL SAA + ∑ w2i ui E(α1 ) = β1 + β2 SAL SAA β2 SAL SAA SAL = 0 51 SAY = ∑ (Ai − ¯ A)(Yi − ¯ Y) SAA = ∑ (Ai − ¯ A)2 wAi = Ai − ¯ A ∑ (Ai − ¯ A)

Slide 52

Slide 52 text

本当はいらないLを入れたら? 52

Slide 53

Slide 53 text

真のモデルが 推定したのが 推定値 に真のモデルを代入 期待をとると 期待値は変わらない。不偏性は保たれ る。 Yi = βo + β1 Ai + ϵi Yi = αo + α1 Ai + α2 L + vi ̂ α1 ̂ α1 = SLL SAY − SAL SLY SAA SLL − S2 AL = ∑ hi Yi = ∑ hi (β0 + β1 Ai + ϵi ) = β0 ∑ hi + β1 ∑ hi Ai + ∑ hi ϵi = β1 + ∑ hi ϵi E( ̂ α1 ) = β1 + ∑ hi E(ϵi ) = β1 53

Slide 54

Slide 54 text

でも,分散は大きくなる 間違えたモデルの分散は 真のモデルでは ここで から 変数の入れすぎは,分散が大き くなる(効率性が落ちる)。 V( ̂ α1 ) = ∑ h2 i E(ϵ2 i ) = σ2 SLL SAA SLL − S2 AL V( ̂ β1 ) = ∑ w2 Ai V(Yi ) = σ2 1 SAA SLL SAA SLL − S2 AL = 1 SAA − S2 AL SLL SAA > SAA − S2 AL SLL 54

Slide 55

Slide 55 text

組織コミットメント パフォーマンス Allen and Meyer(1996) の尺度 個人の月間売上 抽象的 (概念) 具体的 (データ) 操作化 操作化 理論的関係 統計的検証 構成概念妥当性 独立変数 従属変数 外的妥当性 内的妥当性 経験・年齢 統計的結論 妥当性 コントロール変数 Libby et al. (2002)を参考に作成しました。 Libby, R., R. Bloomfield, and M. W. Nelson. 2002. Experimental research in financial accounting. Accounting, Organizations and Society 27 (8): 775–810. 55 参考:会計学でよく使われる研究デザインと妥当性の整理方法

Slide 56

Slide 56 text

木村俊一・古澄英男・鈴川晶夫. 2003. 『確率と統計 : 基礎と応用』. 朝倉書店. 東京大学教養学部統計学教室. 1991. 『基礎統計学』. 東京大学出版会. Libby, R., R. Bloomfield, and M. W. Nelson. 2002. Experimental research in financial accounting. Accounting, Organizations and Society 27 (8): 775–810. 富山大学計量経済学講義資料 唐渡広志先生 http://www3.u-toyama.ac.jp/ kkarato/2017/econometrics/handout/Econometrics-2017-23-1219.pdf [2020/07/10アクセス] 参考文献 56