Upgrade to Pro — share decks privately, control downloads, hide ads and more …

oku-slide-stat1-4

 oku-slide-stat1-4

数理統計学特論I
第4回 統計量と標本分布
奥 牧人 (未病研究センター)
2022/05/11
2023/05/10
2024/05/08

Makito Oku

March 29, 2022
Tweet

More Decks by Makito Oku

Other Decks in Education

Transcript

  1. 今回の位置付け 1. 前置きと準備 2. 確率と1次元の確率変数 3. 多次元の確率変数 4. 統計量と標本分布 5.

    統計的決定理論の枠組み 6. ⼗分統計量 7. 推定論 8. 検定論 9. 区間推定 10. 正規分布、2項分布に関する推測 その他の話題 11. 線形モデル 12. ノンパラメトリック法 13. 漸近理論 14. ベイズ法 確率と統計の基礎 良い点推定とは︖ 良い検定とは︖ 問題設定と準備 7章と8章に関する証明 回帰分析と分散分析を統⼀的に理解 常⽤される⼿法を改めて整理 ベイズ統計を簡単に紹介 ノンパラを簡単に紹介 3 / 43
  2. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 6 / 43
  3. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 7 / 43
  4. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 9 / 43
  5. 標本平均と標本分散 標本平均 標本分散 (不偏推定の場合) 標本分散 (最尤推定の場合) ¯ X = 1

    n n ∑ i=1 Xi s 2 = 1 n − 1 n ∑ i=1 (Xi − ¯ X) 2 s 2 n = 1 n n ∑ i=1 (X i − ¯ X) 2 10 / 43
  6. 統計量と標本分布 統計量とは標本 から実数値への写像 自体が確率変数 標本分布とは、統計量が従う分布のこと 統計量が従う 分布 統計量が従う 分布 統計量が従う

    分布 標本のデータ点の分布 (経験分布) と混同しないよう注意 X = (X1 , … , Xn ) ∈ X T : X → R T (X) χ2 χ2 t t F F 11 / 43
  7. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 12 / 43
  8. 標本平均の標本分布 正規分布に従う独立な確率変数の和は正規分布に従う。 の平均と分散を計算すれば、以下が分かる。 分散が になる理由 ¯ X ¯ X ∼

    N (μ, σ 2 n ) 1/n V [ ¯ X] = V [ X1 + ⋯ + Xn n ] = 1 n2 V [X1 + ⋯ + Xn ] = 1 n2 (V [X1 ] + ⋯ + V [Xn ]) = 1 n2 nσ 2 14 / 43
  9. 分布 のとき、 が従う分布を自由度 の 分布と呼ぶ。 はガンマ分布の特殊な場合で、 に相当する 標本分散に関する が に従う。

    母分散は一般に未知なので、うまく消して使う。 χ 2 X1 , … , Xk i.i.d. ∼ N (0, 1) χ 2 = X 2 1 + ⋯ + X 2 k k χ 2 χ 2 (k) Ga(k/2, 2) p(y) = χ 2 (k) = yk/2−1 e−y/2 2k/2 Γ(k/2) , y > 0 (n − 1)s 2 /σ 2 χ 2 (n − 1) 15 / 43
  10. 自由度が 減る理由 簡単のため , とする。 とし、直交行列 で と変換 直交行列の性質より、 ,

    となるよう の 行目を全て とする となり、また、以下の関係が成り立つ 以上より、実質的に 個の二乗和であることが示せる 1 μ = 0 σ = 1 X = (X1 , … , Xn )T G Y = GX GG T = G T G = I |det G| = 1 Y 1 = √n ¯ X G 1 1/√n Y ∼ N (0, In ) n ∑ i=1 Y 2 i = Y T Y = X T G T GX = X T X = n ∑ i=1 X 2 i n − 1 n ∑ i=1 (Xi − ¯ X) 2 = n ∑ i=1 X 2 i − n ¯ X 2 = n ∑ i=1 Y 2 i − Y 2 1 = n ∑ i=2 Y 2 i 16 / 43
  11. 分布 , , のとき、 が従う分布を自由度 の 分布と呼ぶ。 以下の 統計量は自由度 の

    分布に従う より、 を近似的に標準化したもの 検定の際は を帰無仮説として仮定して使う。 t U ∼ N (0, 1) V ∼ χ 2 (m) U ⊥ ⊥ V t = U √V /m m t t n − 1 t t = √n( ¯ X − μ) s ¯ X ∼ N (μ, σ 2 /n) ¯ X μ = 0 17 / 43
  12. 分布 , , のとき、 が従う分布を自由度 の 分布と呼ぶ。 先ほど が に従うと説明した。

    このように を含むものを分母と分子にして使う。 具体的な確率密度関数の形 (ベータ関数が含まれる) F U ∼ χ 2 (l) V ∼ χ 2 (m) U ⊥ ⊥ V F = U /l V /m (l, m) F (n − 1)s 2 /σ 2 χ 2 (n − 1) σ 2 p(y) = l l/2 m m/2 B(l/2, m/2) y l/2−1 (m + ly)(l+m)/2 19 / 43
  13. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 20 / 43
  14. 非心分布 平均が でない場合の分布を非心分布と呼ぶ。 検出力の計算などで使う。 具体的な確率密度関数は無限級数を含む形で表される。 非心 分布は、 , , のとき、

    が従う分布 (自由度 , 非心度 ) 非心 分布は、 が独立のとき が従う分布 (自由度 , 非心度 ) 非心 分布は、 , , のとき、 が従う分布 (自由度 , 非心度 ) 0 t U ⊥ ⊥ V U ∼ N (λ, 1) V ∼ χ 2 (m) t = U /√V /m m λ χ 2 Xi ∼ N (μi , 1), (i = 1, … , m) χ2 = ∑ X 2 i m λ = ∑ μ2 i F U ⊥ ⊥ V U ∼ χ 2 (l, λ) V ∼ χ 2 (m) F = (U /l)/(V /m) (l, m) λ 21 / 43
  15. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 22 / 43
  16. 大数の法則 仮定 ある分布 があって、 , が存在 大数の法則 より正確に書くと、標本平均が母平均に確率収束する。 確率収束ということを明示するには のように書く。

    F X1 , … , Xn i.i.d. ∼ F E[Xi ] = μ V [Xi ] = σ 2 ¯ X → μ, (n → ∞) ∀ε > 0, lim n→∞ P (| ¯ X − μ| ≥ ε) = 0 ¯ X p → μ 24 / 43
  17. 大数の法則の証明の準備 マルコフの不等式 とし、 とする。このとき、 証明は板書 チェビシェフの不等式 とし、 , が存在するとき、 マルコフの不等式に

    , を代入 X ≥ 0 E[X] < ∞ ∀c > 0, P (X ≥ c) ≤ E[X] c X ∈ R E[X] = μ V [X] = σ2 ∀c > 0, P (|X − μ| ≥ c) ≤ σ2 c2 X ← (X − μ) 2 c ← c 2 25 / 43
  18. 大数の法則の証明 チェビシェフの不等式に を代入 ( に注意) で右辺が に収束、証明終 X ← ¯

    X V [ ¯ X] = σ 2 /n ∀c > 0, P (| ¯ X − μ| ≥ c) ≤ σ2 nc2 n → ∞ 0 26 / 43
  19. 平均以外にも当てはまる 例、分散 独立なものを足して で割る形にすれば良いので、 s 2 p → σ 2

    , (n → ∞) n s 2 = 1 n − 1 n ∑ i=1 (Xi − ¯ X) 2 = 1 n − 1 ( n ∑ i=1 X 2 i − n ¯ X 2 ) = n n − 1 ( 1 n n ∑ i=1 X 2 i − ¯ X 2 ) p → 1 × (E[X 2 i ] − μ 2 ) = σ 2 27 / 43
  20. 中心極限定理の証明 とし、 について考える。 , より、 の特性関数は以下のように テーラー展開出来る ( は、それより速く に収束、を表す)

    このとき、 の特性関数は これは標準正規分布の特性関数である。証明終 Zi = (Xi − μ)/σ √n ¯ Z E[Zi ] = 0 V [Zi ] = 1 Z o 0 ϕ(t) = 1 − t 2 2 + o(t 2 ) √n ¯ Z = (Z1 + ⋯ Zn )/√n ϕn (t) = ϕ(t/√n) n = (1 − t 2 2n + o ( t 2 n )) n → e −t 2 /2 , (n → ∞) 31 / 43
  21. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 32 / 43
  22. 二項分布の例 を とみなす。 , より、 が十分大きければ なので 二項分布が正規分布に収束することが確認出来た。 X ∼

    Bin(n, p) Y1 , … , Yn i.i.d. ∼ Bin(1, p) E[Yi ] = p V [Yi ] = p(1 − p) n ¯ Y ⋅ ∼ N (p, p(1 − p) n ) X = ∑ n i=1 Yi = n ¯ Y X ⋅ ∼ N (np, np(1 − p)) 33 / 43
  23. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 35 / 43
  24. 順序統計量 とする。 これらを小さい順に並べたとき、 番目の値を第 順序統計量と 呼ぶことにする。 最大値 (第 順序統計量) の標本分布

    最小値 (第 順序統計量) の標本分布 X1 , … , Xn i.i.d. ∼ F i i n P (max i Xi ≤ x) = F (x) n 1 P (min i Xi ≤ x) = 1 − (1 − F (x)) n 36 / 43
  25. Outline 1. 母集団と標本 2. 統計量と標本分布 3. 正規分布のもとでの標本分布論 4. 非心分布論 5.

    確率論のいくつかの基本的な極限定理 6. 標本平均の分布の漸近理論 7. 順序統計量と経験分布関数 8. 有限母集団からの非復元抽出 38 / 43
  26. まとめ (前半) 主な統計量と標本分布の意味を説明しました。 1. 母集団と標本 2. 統計量と標本分布 ! 標本平均と標本分散の式を書ける? 3.

    正規分布のもとでの標本分布論 ! 分布、 分布、 分布の意味を説明できる? 4. 非心分布論 χ 2 t F 40 / 43