Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計学入門講座 第6回スライド

統計学入門講座 第6回スライド

てくますプロジェクトで行った統計学入門講座の第6回スライドです。
実施:2025/01/06

Avatar for TechmathProject

TechmathProject

August 11, 2025
Tweet

More Decks by TechmathProject

Other Decks in Science

Transcript

  1. てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,

    私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
  2. 本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,

    後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
  3. スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18

    第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
  4. 区間推定と信頼区間 母集団 標本 抽出 推測 知りたい • 母平均 • 母分散

    • 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母平均や母分散などの母数を区間で推測することを区間推定といいます. また, 信頼区間とは, 区間推定の結果得られる「母数が含まれている可能性の高い範囲」のことをいい ます. 例えば, 母平均の95%信頼区間の場合, 「この計算方法を繰り返したとき, 95%の確率で母平均が信頼区 間に含まれる」ことを意味します. 今日のテーマ!
  5. 標本分散について 母分散と標本分散は計算方法が異なることに注意が必要です. 母分散:偏差(母平均からの差)の2乗の和をデータ数で割った値(つまり偏差の2乗の平均値) 標本分散:偏差(標本平均からの差)の2乗の和を データ数 - 1 で割った値 標本平均: 標本分散:

    標本標準偏差: 偏差の自由度の数 =意味のある偏差の数 ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65
  6. 複数データの平均値は1個のデータより分散が小さくなる 分散が小さくなれば, 予測の範囲を狭めることができます. そのことを確かめましょう. ある母集団は母平均100, 母標準偏差20の正規分布に従います. この母集団からデータを抽出します. (1) 標本サイズ16の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか

    (2) 標本サイズ64の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか. (1) 標本平均  の分布は, 平均値100, 標準偏差 20/√16=5 の 正規分布です. (2) 標本平均  の分布は, 平均値100, 標準偏差 20/√64=2.5 の 正規分布です. 予測の範囲が狭くなりました
  7. ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,

    63, 61, 65 母分散  は12であるとし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう. 母平均の区間推定(母分散既知ver) 標本平均  の分布は, • 平均値:母平均  と同じ • 分散:母分散  をサンプルサイズで割った値なので, 12÷10=1.2 • 標準偏差:√1.2≒1.095 の正規分布となります. 観測で得られた標本平均は, このデータを標準化すると,
  8. 65 は母平均  の95%信頼区間         に入っていません. これは,     が -1.96以上1.96以下の範囲に入っていない(=棄却域に入る)ことを意味します. よって, 母平均  が65である仮説は棄却されます. 母平均の検定(母分散既知ver) ある生物学の実験で,

    10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は12であるとし, 母集団は正規分布に従うと仮定します. 母平均  が65であるか検定しましょう. 有意水準は 5%(両側検定)とします. ※本問において, 母平均が分からないのに母分散が分かっているというのは都合が良いように感じられ  ます. 次は, 母分散も分かっていないケースを考えましょう.
  9. ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,

    63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) 標本平均  の分布は, • 平均値:母平均  と同じ • 分散:??? • 標準偏差:??? の正規分布となります. ➡ 観測で得られた標本平均 60.4 の標準化を先ほどのように行うことができません. そこで今回, 母標準偏差 の代わりに標本標準偏差 を使用して標準化することを考えましょう.
  10. ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,

    63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver)           ではなく    で標準化します. これを Student化 と呼びます. Student化で得られたデータはもはや標準正規分布に従いません. その代わりに, 自由度   の t分布 に従うことが知られています.
  11. 母平均の区間推定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,

    57, 63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう.      が自由度 9 の t分布 に従います. 95%信頼区間を求めたいので, よって, 母平均  の95%信頼区間は
  12. 母平均の検定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,

    57, 63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  が62であるか検定しましょう. 有意水準は 5%(両側検定)とします. 62 は母平均  の95%信頼区間         に入っています. これは,     が -1.96以上1.96以下の範囲に入っている(=棄却域に入らない)ことを意味します. よって, 母平均  が62である仮説は棄却されません. (  が62であることが妥当であると判断したわけではないことに注意)
  13. まとめ • 標本分散を計算する際は, n ではなく n-1 で割ることに注意しましょう. • 複数データの平均値は1個のデータより分散が小さくなります. そのため,

    標本のサンプルサイズを大きくすることは重要です. • 母平均の区間推定 ◦ 母分散が既知の場合     が標準正規分布に従うことを利用しましょう ◦ 母分散が未知の場合     が自由度 n-1 の t分布 に従うことを利用しましょう.