Slide 1

Slide 1 text

統計学入門講座 第6回 母平均の検定 てくますプロジェクト

Slide 2

Slide 2 text

てくますプロジェクトについて ● てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. ● 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために, 私たちは活動しています. ● 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. ● X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) ● 講師はゆっきん(桑原)が担当します. ○ 数学教師→システムエンジニア→プログラミング講師 ○ 数学, プログラミング, ボードゲームが好きです. ○ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.

Slide 3

Slide 3 text

本講座について ● 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. ● 本講座は各回, 前半で知識のインプット, 後半で問題演習を行います. ● 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! ● 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. ● 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.

Slide 4

Slide 4 text

スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18 第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.

Slide 5

Slide 5 text

目次 1. 母集団と標本 母平均の検定に入る前に, 母集団と標本に関するいくつかのトピックを紹介します. 2. 母平均の検定(母分散既知ver) 母分散が分かっている状態で母平均を検定する方法を学びます. 3. 母平均の検定(母分散未知ver) 母分散が分かっていない状態で母平均を検定する方法を学びます.

Slide 6

Slide 6 text

母集団と標本

Slide 7

Slide 7 text

区間推定と信頼区間 母集団 標本 抽出 推測 知りたい ● 母平均 ● 母分散 ● 母標準偏差 ● 母比率 計算できる ● 標本平均 ● 標本分散 ● 標本標準偏差 ● 標本比率 母平均や母分散などの母数を区間で推測することを区間推定といいます. また, 信頼区間とは, 区間推定の結果得られる「母数が含まれている可能性の高い範囲」のことをいい ます. 例えば, 母平均の95%信頼区間の場合, 「この計算方法を繰り返したとき, 95%の確率で母平均が信頼区 間に含まれる」ことを意味します. 今日のテーマ!

Slide 8

Slide 8 text

標本分散について 母分散と標本分散は計算方法が異なることに注意が必要です. 母分散:偏差(母平均からの差)の2乗の和をデータ数で割った値(つまり偏差の2乗の平均値) 標本分散:偏差(標本平均からの差)の2乗の和を データ数 - 1 で割った値 標本平均: 標本分散: 標本標準偏差: 偏差の自由度の数 =意味のある偏差の数 ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65

Slide 9

Slide 9 text

複数データの平均値は1個のデータより分散が小さくなる さいころ投げにおいて出る目の母平均は 3.5 です. さいころを投げる試行を1回行ったとき 出る目の期待値:3.5 出る目の分散: さいころを投げる試行を2回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散: さいころを投げる試行をn回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散: n個のデータの平均値の分散は 1個のデータの分散の 倍

Slide 10

Slide 10 text

複数データの平均値は1個のデータより分散が小さくなる 分散が小さくなれば, 予測の範囲を狭めることができます. そのことを確かめましょう. ある母集団は母平均100, 母標準偏差20の正規分布に従います. この母集団からデータを抽出します. (1) 標本サイズ16の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか (2) 標本サイズ64の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか. (1) 標本平均  の分布は, 平均値100, 標準偏差 20/√16=5 の 正規分布です. (2) 標本平均  の分布は, 平均値100, 標準偏差 20/√64=2.5 の 正規分布です. 予測の範囲が狭くなりました

Slide 11

Slide 11 text

母平均の検定(母分散既知ver)

Slide 12

Slide 12 text

ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は12であるとし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう. 母平均の区間推定(母分散既知ver) 標本平均  の分布は, ● 平均値:母平均  と同じ ● 分散:母分散  をサンプルサイズで割った値なので, 12÷10=1.2 ● 標準偏差:√1.2≒1.095 の正規分布となります. 観測で得られた標本平均は, このデータを標準化すると,

Slide 13

Slide 13 text

母平均の区間推定(母分散既知ver) 95%信頼区間を求めたいので, よって, 母平均  の95%信頼区間は ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は12であるとし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう.

Slide 14

Slide 14 text

65 は母平均  の95%信頼区間         に入っていません. これは,     が -1.96以上1.96以下の範囲に入っていない(=棄却域に入る)ことを意味します. よって, 母平均  が65である仮説は棄却されます. 母平均の検定(母分散既知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は12であるとし, 母集団は正規分布に従うと仮定します. 母平均  が65であるか検定しましょう. 有意水準は 5%(両側検定)とします. ※本問において, 母平均が分からないのに母分散が分かっているというのは都合が良いように感じられ  ます. 次は, 母分散も分かっていないケースを考えましょう.

Slide 15

Slide 15 text

母平均の検定(母分散未知ver)

Slide 16

Slide 16 text

ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) 標本平均  の分布は, ● 平均値:母平均  と同じ ● 分散:??? ● 標準偏差:??? の正規分布となります. ➡ 観測で得られた標本平均 60.4 の標準化を先ほどのように行うことができません. そこで今回, 母標準偏差 の代わりに標本標準偏差 を使用して標準化することを考えましょう.

Slide 17

Slide 17 text

ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver)           ではなく    で標準化します. これを Student化 と呼びます. Student化で得られたデータはもはや標準正規分布に従いません. その代わりに, 自由度   の t分布 に従うことが知られています.

Slide 18

Slide 18 text

母平均の区間推定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  の95%信頼区間を求めましょう.      が自由度 9 の t分布 に従います. 95%信頼区間を求めたいので, よって, 母平均  の95%信頼区間は

Slide 19

Slide 19 text

母平均の検定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散  は未知とし, 母集団は正規分布に従うと仮定します. 母平均  が62であるか検定しましょう. 有意水準は 5%(両側検定)とします. 62 は母平均  の95%信頼区間         に入っています. これは,     が -1.96以上1.96以下の範囲に入っている(=棄却域に入らない)ことを意味します. よって, 母平均  が62である仮説は棄却されません. (  が62であることが妥当であると判断したわけではないことに注意)

Slide 20

Slide 20 text

まとめ ● 標本分散を計算する際は, n ではなく n-1 で割ることに注意しましょう. ● 複数データの平均値は1個のデータより分散が小さくなります. そのため, 標本のサンプルサイズを大きくすることは重要です. ● 母平均の区間推定 ○ 母分散が既知の場合     が標準正規分布に従うことを利用しましょう ○ 母分散が未知の場合     が自由度 n-1 の t分布 に従うことを利用しましょう.

Slide 21

Slide 21 text

演習問題を解こう!