Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計学入門講座 第6回スライド
Search
TechmathProject
August 11, 2025
Science
0
14
統計学入門講座 第6回スライド
てくますプロジェクトで行った統計学入門講座の第6回スライドです。
実施:2025/01/06
TechmathProject
August 11, 2025
Tweet
Share
More Decks by TechmathProject
See All by TechmathProject
統計学入門講座 第5回スライド
techmathproject
0
31
統計学入門講座 第7回スライド
techmathproject
0
13
統計学入門講座 第8回スライド
techmathproject
0
12
統計学入門講座 第4回スライド
techmathproject
0
200
統計学入門講座 第3回スライド
techmathproject
0
140
統計学入門講座 第2回スライド
techmathproject
0
200
統計学入門講座 第1回スライド
techmathproject
0
480
線形代数学入門講座 第1回スライド
techmathproject
0
120
線形代数学入門講座 第2回スライド
techmathproject
0
85
Other Decks in Science
See All in Science
実力評価性能を考慮した弓道高校生全国大会の大会制度設計の提案 / (konakalab presentation at MSS 2025.03)
konakalab
2
210
「美は世界を救う」を心理学で実証したい~クラファンを通じた新しい研究方法
jimpe_hitsuwari
1
170
academist Prize 4期生 研究トーク延長戦!「美は世界を救う」っていうけど、どうやって?
jimpe_hitsuwari
0
410
データマイニング - ウェブとグラフ
trycycle
PRO
0
190
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
870
People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text
rudorudo11
0
130
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
330
アナログ計算機『計算尺』を愛でる Midosuji Tech #4/Analog Computing Device Slide Rule now and then
quiver
1
310
Lean4による汎化誤差評価の形式化
milano0017
1
340
データマイニング - グラフ構造の諸指標
trycycle
PRO
0
200
データベース01: データベースを使わない世界
trycycle
PRO
1
830
地質研究者が苦労しながら運用する情報公開システムの実例
naito2000
0
290
Featured
See All Featured
Building an army of robots
kneath
305
46k
Why Our Code Smells
bkeepers
PRO
340
57k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
What's in a price? How to price your products and services
michaelherold
246
12k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.7k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Code Reviewing Like a Champion
maltzj
526
40k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.2k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
Large-scale JavaScript Application Architecture
addyosmani
514
110k
Transcript
統計学入門講座 第6回 母平均の検定 てくますプロジェクト
てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18
第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
目次 1. 母集団と標本 母平均の検定に入る前に, 母集団と標本に関するいくつかのトピックを紹介します. 2. 母平均の検定(母分散既知ver) 母分散が分かっている状態で母平均を検定する方法を学びます. 3. 母平均の検定(母分散未知ver)
母分散が分かっていない状態で母平均を検定する方法を学びます.
母集団と標本
区間推定と信頼区間 母集団 標本 抽出 推測 知りたい • 母平均 • 母分散
• 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母平均や母分散などの母数を区間で推測することを区間推定といいます. また, 信頼区間とは, 区間推定の結果得られる「母数が含まれている可能性の高い範囲」のことをいい ます. 例えば, 母平均の95%信頼区間の場合, 「この計算方法を繰り返したとき, 95%の確率で母平均が信頼区 間に含まれる」ことを意味します. 今日のテーマ!
標本分散について 母分散と標本分散は計算方法が異なることに注意が必要です. 母分散:偏差(母平均からの差)の2乗の和をデータ数で割った値(つまり偏差の2乗の平均値) 標本分散:偏差(標本平均からの差)の2乗の和を データ数 - 1 で割った値 標本平均: 標本分散:
標本標準偏差: 偏差の自由度の数 =意味のある偏差の数 ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65
複数データの平均値は1個のデータより分散が小さくなる さいころ投げにおいて出る目の母平均は 3.5 です. さいころを投げる試行を1回行ったとき 出る目の期待値:3.5 出る目の分散: さいころを投げる試行を2回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散:
さいころを投げる試行をn回行ったとき 出る目の平均値の期待値:3.5 出る目の平均値の分散: n個のデータの平均値の分散は 1個のデータの分散の 倍
複数データの平均値は1個のデータより分散が小さくなる 分散が小さくなれば, 予測の範囲を狭めることができます. そのことを確かめましょう. ある母集団は母平均100, 母標準偏差20の正規分布に従います. この母集団からデータを抽出します. (1) 標本サイズ16の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか
(2) 標本サイズ64の場合, 標本平均が95%の確率でどの範囲に収まるでしょうか. (1) 標本平均 の分布は, 平均値100, 標準偏差 20/√16=5 の 正規分布です. (2) 標本平均 の分布は, 平均値100, 標準偏差 20/√64=2.5 の 正規分布です. 予測の範囲が狭くなりました
母平均の検定(母分散既知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散既知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:母分散 をサンプルサイズで割った値なので, 12÷10=1.2 • 標準偏差:√1.2≒1.095 の正規分布となります. 観測で得られた標本平均は, このデータを標準化すると,
母平均の区間推定(母分散既知ver) 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62,
58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう.
65 は母平均 の95%信頼区間 に入っていません. これは, が -1.96以上1.96以下の範囲に入っていない(=棄却域に入る)ことを意味します. よって, 母平均 が65である仮説は棄却されます. 母平均の検定(母分散既知ver) ある生物学の実験で,
10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57, 63, 61, 65 母分散 は12であるとし, 母集団は正規分布に従うと仮定します. 母平均 が65であるか検定しましょう. 有意水準は 5%(両側検定)とします. ※本問において, 母平均が分からないのに母分散が分かっているというのは都合が良いように感じられ ます. 次は, 母分散も分かっていないケースを考えましょう.
母平均の検定(母分散未知ver)
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) 標本平均 の分布は, • 平均値:母平均 と同じ • 分散:??? • 標準偏差:??? の正規分布となります. ➡ 観測で得られた標本平均 60.4 の標準化を先ほどのように行うことができません. そこで今回, 母標準偏差 の代わりに標本標準偏差 を使用して標準化することを考えましょう.
ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59, 57,
63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. 母平均の区間推定(母分散未知ver) ではなく で標準化します. これを Student化 と呼びます. Student化で得られたデータはもはや標準正規分布に従いません. その代わりに, 自由度 の t分布 に従うことが知られています.
母平均の区間推定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 の95%信頼区間を求めましょう. が自由度 9 の t分布 に従います. 95%信頼区間を求めたいので, よって, 母平均 の95%信頼区間は
母平均の検定(母分散未知ver) ある生物学の実験で, 10匹の実験動物の体重を無作為に収集した. 得られたデータは以下の通りです. 55, 62, 58, 60, 64, 59,
57, 63, 61, 65 母分散 は未知とし, 母集団は正規分布に従うと仮定します. 母平均 が62であるか検定しましょう. 有意水準は 5%(両側検定)とします. 62 は母平均 の95%信頼区間 に入っています. これは, が -1.96以上1.96以下の範囲に入っている(=棄却域に入らない)ことを意味します. よって, 母平均 が62である仮説は棄却されません. ( が62であることが妥当であると判断したわけではないことに注意)
まとめ • 標本分散を計算する際は, n ではなく n-1 で割ることに注意しましょう. • 複数データの平均値は1個のデータより分散が小さくなります. そのため,
標本のサンプルサイズを大きくすることは重要です. • 母平均の区間推定 ◦ 母分散が既知の場合 が標準正規分布に従うことを利用しましょう ◦ 母分散が未知の場合 が自由度 n-1 の t分布 に従うことを利用しましょう.
演習問題を解こう!