Upgrade to Pro — share decks privately, control downloads, hide ads and more …

oku-slide-stat2-3

 oku-slide-stat2-3

数理統計学特論II
第3回 区間推定
奥 牧人 (未病研究センター)
2022/06/29
2023/06/28
2024/06/26
2025/07/02

Avatar for Makito Oku

Makito Oku

March 29, 2022
Tweet

More Decks by Makito Oku

Other Decks in Education

Transcript

  1. 今回の位置付け 1. 前置きと準備 2. 確率と1次元の確率変数 3. 多次元の確率変数 4. 統計量と標本分布 5.

    統計的決定理論の枠組み 6. ⼗分統計量 7. 推定論 8. 検定論 9. 区間推定 10. 正規分布、2項分布に関する推測 その他の話題 11. 線形モデル 12. ノンパラメトリック法 13. 漸近理論 14. ベイズ法 確率と統計の基礎 良い点推定とは︖ 良い検定とは︖ 問題設定と準備 7章と8章に関する証明 回帰分析と分散分析を統⼀的に理解 常⽤される⼿法を改めて整理 ベイズ統計を簡単に紹介 ノンパラを簡単に紹介 3 / 29
  2. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 6 / 29
  3. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 7 / 29
  4. 区間推定の例 正規分布の平均の区間推定について考える。 母平均 、母分散 、標本サイズ とする。 点推定 だが、 は未知なので を使って

    の標準偏 差を推定 これを の標準誤差という。 μ σ2 n ¯ X = 1 n n ∑ i=1 Xi , s 2 = 1 n − 1 n ∑ i=1 (Xi − ¯ X) 2 ¯ X ∼ N (μ, σ 2 /n) σ s ¯ X ^ σ ¯ X = s √n ¯ X 8 / 29
  5. 区間推定の例、続き %信頼区間は近似的には の範囲 意味は、母平均 を %の確率で含む区間 が大文字 (確率変数) であることに注意 信頼区間

    きちんと書くと ここで は自由度 の 分布の上側 点 95 ¯ X ± 1.96 ^ σ ¯ X μ 95 X 1 − α ¯ X ± t α/2 (n − 1)^ σ ¯ X [L(X), U (X)] = [ ¯ X − t α/2 (n − 1) s √n , ¯ X + t α/2 (n − 1) s √n ] t α/2 (n − 1) n − 1 t α/2 9 / 29
  6. 合っているか確認 実際に計算してみると P (L(X) ≤ μ ≤ U (X)) =

    P ( ¯ X − tα/2 (n − 1) s √n ≤ μ ≤ ¯ X + tα/2 (n − 1) s √n ) = P (−t α/2 (n − 1) s √n ≤ ¯ X − μ ≤ t α/2 (n − 1) s √n ) = P (−t α/2 (n − 1) ≤ √n( ¯ X − μ) s ≤ t α/2 (n − 1)) = 1 − α 10 / 29
  7. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 12 / 29
  8. 区間推定と検定の関係 以下の検定問題を考える 有意水準 の (非確率化) 検定の受容域を とおく 書き直すと [補題] 全ての

    に対して上式を満たす が存在するなら ば、以下の集合は信頼係数 の信頼域である H0 : θ = θ0 vs. H1 : θ ≠ θ0 α A(θ0 ) P (X ∉ A(θ0 ) ∣ H0 ) ≤ α P (X ∈ A(θ0 ) ∣ H0 ) ≥ 1 − α θ0 A(θ0 ) 1 − α S(X) = {θ ∣ X ∈ A(θ)} 13 / 29
  9. 証明 任意の に対して、 より となるから 従って、 は信頼係数 の信頼域である。 θ0 ∈

    Θ S(X) = {θ ∣ X ∈ A(θ)} θ0 ∈ S(X) ⇔ X ∈ A(θ0 ) P (θ0 ∈ S(X) ∣ θ = θ0 ) = P (X ∈ A(θ0 ) ∣ θ = θ0 ) ≥ 1 − α S(X) 1 − α 14 / 29
  10. 先ほどの例 両側 検定で 統計量が受容域に入ること が信頼区間に入ること が対応していた。 t t −t α/2

    (n − 1) ≤ √n( ¯ X − μ) s ≤ t α/2 (n − 1) μ ¯ X − t α/2 (n − 1) s √n ≤ μ ≤ ¯ X + t α/2 (n − 1) s √n 15 / 29
  11. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 16 / 29
  12. 信頼区間の解釈上の注意 古典的統計学では、信頼区間や信頼域が実現値の場合、信頼係数 のことを 確率と言ってはいけない ことになっている。 その理由は、母数 の値が未知ではあるものの固定値のため、 ある区間は「含む」か「含まないか」のいずれかだからである、 と通常説明される。 極端な例

    標本と関係なく確率 で母数空間全体、確率 で空集合 となる信頼域 を考える。 , のいずれが実現した場合でも、 が を含む確率は とは異なる。 1 − α θ 1 − α α S P (S = Θ) = 1 − α, P (S = ∅) = α Θ ∅ S θ 1 − α 17 / 29
  13. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 19 / 29
  14. 信頼区間の最適性 信頼区間の最適性は検定との対応関係から自然と出てくる。 不偏検定 (有意水準は ) 不偏信頼域 (信頼係数は ) α β(θ)

    ≤ α, ∀θ ∈ Θ0 β(θ) ≥ α, ∀θ ∈ Θ1 1 − α P (θ0 ∈ S(X) ∣ θ = θ0 ) ≥ 1 − α, ∀θ0 P (θ1 ∈ S(X) ∣ θ = θ0 ) ≤ 1 − α, ∀θ0 , ∀θ1 , θ0 ≠ θ1 20 / 29
  15. 信頼区間の最適性、続き 一様最強力不偏検定 ( は不偏かつ有意水準 ) 一様最強力不偏信頼域 ( は不偏かつ信頼係数 ) 真の母数以外の母数が含まれる確率が不偏の中で最小

    母数空間上の体積 (区間の場合は長さ) も不偏の中で最小 δ, δ ∗ α βδ∗ (θ) ≥ βδ (θ), ∀θ ∈ Θ1 , ∀δ S, S ∗ 1 − α P (θ1 ∈ S ∗ (X) ∣ θ = θ0 ) ≤ P (θ1 ∈ S(X) ∣ θ = θ0 ), ∀θ0 , ∀θ1 , θ0 ≠ θ1 , ∀S 21 / 29
  16. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 22 / 29
  17. 最尤推定量に基づく信頼区間 最尤推定量 の標本分布は が大きいとき以下で近似出来る ここで は のときのフィッシャー情報量 受容域 (正規分布の上側 点を

    とする) 信頼区間 ^ θ n ^ θ ⋅ ∼ N (θ, 1 nI(θ) ) I(θ) n = 1 α/2 zα/2 −z α/2 ≤ √nI(θ)( ^ θ − θ) ≤ z α/2 ^ θ − zα/2 √nI(θ) ≤ θ ≤ ^ θ + zα/2 √nI(θ) 23 / 29
  18. Outline 1. 区間推定の例 2. 信頼域の構成法 3. 信頼区間の解釈 4. 信頼区間の最適性 5.

    最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 24 / 29
  19. 同時信頼域 母数が多次元の場合を考える。 信頼域を要素毎の区間 の直積で表すとする。 例、 , , なら正方形の範囲 各次元について以下が成り立つようにしておく。 全体として信頼係数

    となるよう を調節する。 θ = (θ1 , … , θk ) R1 , … , Rk S = R 1 × ⋯ × R k k = 2 R1 = [0, 1] R2 = [0, 1] P (θi ∈ Ri ) = 1 − α ′ , ∀i 1 − α α ′ 25 / 29
  20. ボンフェロニの補正 事象 について一般に以下が成り立つ これらを用いて 各 を となる事象とすれば、 従って、 とすれば良い。 実用上は多次元の信頼域より多重検定でよく使う補正

    A1 , … , Ak P (A1 ∪ ⋯ ∪ Ak ) ≤ P (A1 ) + ⋯ + P (Ak ) (A1 ∩ ⋯ ∩ Ak ) c = A c 1 ∪ ⋯ ∪ A c k P (A1 ∩ ⋯ ∩ Ak ) = 1 − P (A c 1 ∪ ⋯ ∪ A c k ) ≥ 1 − P (A c 1 ) − ⋯ − P (A c k ) Ai θi ∈ Ri P (θ ∈ S) ≥ 1 − kα ′ = 1 − α α ′ = α/k 26 / 29
  21. まとめ 区間推定の意味と検定との対応関係を説明しました。 1. 区間推定の例 ! 信頼区間の意味を説明できる? 2. 信頼域の構成法 ! 信頼区間や信頼域と検定の対応関係を説明できる?

    3. 信頼区間の解釈 ! 信頼区間の解釈上の注意点を説明できる? 4. 信頼区間の最適性 ! 一様最強力不偏信頼域の意味を説明できる? 5. 最尤推定量に基づく信頼区間 6. 同時信頼域に関する諸問題 27 / 29