Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計学入門講座 第5回スライド
Search
TechmathProject
August 11, 2025
Science
110
0
Share
統計学入門講座 第5回スライド
てくますプロジェクトで行った統計学入門講座の第5回スライドです。
実施:2024/12/16
TechmathProject
August 11, 2025
More Decks by TechmathProject
See All by TechmathProject
統計学入門講座 第6回スライド
techmathproject
0
93
統計学入門講座 第7回スライド
techmathproject
0
100
統計学入門講座 第8回スライド
techmathproject
0
100
統計学入門講座 第4回スライド
techmathproject
0
350
統計学入門講座 第3回スライド
techmathproject
0
240
統計学入門講座 第2回スライド
techmathproject
0
360
統計学入門講座 第1回スライド
techmathproject
0
760
線形代数学入門講座 第1回スライド
techmathproject
0
300
線形代数学入門講座 第2回スライド
techmathproject
0
170
Other Decks in Science
See All in Science
Bリーグのショットデータを活用した得点期待値モデルの構築 / Construction of expected points model using shot data of B.LEAGUE
konakalab
0
140
データベース02: データベースの概念
trycycle
PRO
2
1.2k
【RSJ2025】PAMIQ Core: リアルタイム継続学習のための⾮同期推論・学習フレームワーク
gesonanko
0
880
AI bij literatuuronderzoek in de wetenschap
voginip
0
160
白金鉱業Meetup_Vol.20 効果検証ことはじめ / Introduction to Impact Evaluation
brainpadpr
2
1.9k
Kaggle: NeurIPS - Open Polymer Prediction 2025 コンペ 反省会
calpis10000
0
580
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
1.4k
機械学習 - 授業概要
trycycle
PRO
0
510
チュートリアル:世界モデル
hf149
0
1.6k
AIを用いた PID制御で部屋 の温度制御をしてみた
nearme_tech
PRO
0
130
AkarengaLT vol.41
hashimoto_kei
1
140
なぜエネルギーは保存する? 〜自由落下でわかる“対称性”とネーターの定理〜
syotasasaki593876
0
170
Featured
See All Featured
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
460
Six Lessons from altMBA
skipperchong
29
4.3k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.4k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
570
Information Architects: The Missing Link in Design Systems
soysaucechin
0
960
Optimizing for Happiness
mojombo
378
71k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
22k
From π to Pie charts
rasagy
0
200
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.3k
Transcript
統計学入門講座 第5回 検定の枠組み てくますプロジェクト
てくますプロジェクトについて • てくますプロジェクトは, 「考える楽しさを探そう!」が合言葉の, 数学と情報科学の学習コミュニティです. • 数学や情報科学は, 誰にとっても役立ち, 趣味としても楽しめるものです. その魅力を伝えるために,
私たちは活動しています. • 輪読会や講座の実施, 記事などのコンテンツ制作を行っています. • X などで宣伝いただけると大変嬉しいです. (#てくますプロジェクト) • 講師はゆっきん(桑原)が担当します. ◦ 数学教師→システムエンジニア→プログラミング講師 ◦ 数学, プログラミング, ボードゲームが好きです. ◦ てくますプロジェクトやボードゲームコミュニティの運営を 行っています.
本講座について • 本講座は統計学を初めて学ぶ方や, 学び直したい方を対象としています. 本講座の前半は高校数学レベル, 後半は大学教養レベルです. 統計検定2級を目指す方にも適した内容です. • 本講座は各回, 前半で知識のインプット,
後半で問題演習を行います. • 高校や大学以外で数学を学ぶことのできる貴重な場です. 数学を学びたい人たちが集まっていますので, ぜひ交流してください! • 本講座作成にあたり, 特に参考にした本を 右に挙げておきます. 2冊ともオススメです. • 後ろから顔が映らないように写真を撮ることがあります. ご了承ください.
スケジュール 第1回 データの整理 2024/10/07 第4回 確率分布 2024/12/02 第3回 確率の基本 2024/11/18
第2回 データの散らばり 2024/10/28 第5回 検定の枠組み 2024/12/16 第8回 2標本t検定 2025/02/10 第6回 母平均の検定 2025/01/06 第7回 母分散, 母比率の検定 2025/01/27 本講座は全8回です. 各回の内容は以下の通りです.
目次 1. 標準正規分布を使った予測 標準正規分布表を使って, 正規分布に関する確率を求められるようになりましょう. 2. 仮説検定をしよう 標準正規分布を使った予測を仮説検定に逆用する方法を学びます.
標準正規分布を使った予測
正規分布の復習 正規分布は最もよく知られた確率分布で, 人間の身長や試験の点数など, さまざまな場面で登場します. 特に, 平均値が 0, 標準偏差が 1 の正規分布を標準正規分布と呼びました.
標準正規分布から観測したデータについて -1 〜 1 の範囲にある確率:約68% -2 〜 2 の範囲にある確率:約95% 標準正規分布
標準正規分布表を使おう 標準正規分布表を用いれば, 標準正規分布に関する 他の範囲の確率を求めることができます. 例1 観測したデータが 1.65 以上の確率 表の縦軸が1.6, 横軸が0.05のところを確認し,
0.0495(=4.95%) 例2 観測したデータが -1 以下の確率 グラフの左右対称性より 1 以上の確率と同じなので, 0.1587(=15.87%) 例3 観測したデータが -1 以上の確率 1 - 0.1587 = 0.8413(=84.13%)
正規分布を標準正規分布に変換(標準化) データ x が平均値が μ, 標準偏差が σ の正規分布のデータであるとき, という加工をすると, データ
z は標準正規分布のデータになります. 平均値が μ, 標準偏差が σ の正規分布 ⬇ 全データから μ を引 く 平均値が 0, 標準偏差が σ の正規分布 ⬇ 全データを σ で割る 平均値が 0, 標準偏差が 1 の正規分布 上の式はデータが平均値から標準偏差何個分 離れているかを調べる式でもあります.
具体例1 あるテストの点数が平均値 60 点, 標準偏差 12 点の正規分布に従っているとします. • 観測したデータが 80
点以上の確率は? 標準正規分布で観測したデータが 1.67 以上の確率は 0.0475(=4.75%) • 観測したデータが上位 1 % であるためには何点以上取らなければならない? 88 点以上で上位 1 %になる.
具体例2 (表裏の出る確率が等しい)コインを 400 回投げたとします. 表が出た回数は, 二項分布に従います.(第4回を参照) • 平均値:400×0.5=200 • 分散:400×0.5×0.5=100
• 標準偏差:10 試行回数が十分多いとき, 近似的に正規分布であると考えられます.(中心極限定理) 表が出た回数が 220 回以上の確率は? 標準正規分布で観測したデータが 2 以上の確率は 0.0228(=2.28%)
仮説検定をしよう
母集団の推定 推測統計は得られた一部のデータをもとに, 背後に広がる全データの特徴を推測する学問です. 得られた一部のデータのことを標本と呼び, 背後に広がる全データを母集団と呼びます. 母集団 標本 抽出 推測 知りたい
• 母平均 • 母分散 • 母標準偏差 • 母比率 計算できる • 標本平均 • 標本分散 • 標本標準偏差 • 標本比率 母集団を特徴づけるこれらの値を 母数と呼びます
仮説検定をしよう (表裏の出る確率が等しい)N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問:Nとして 80 を考えることは妥当でしょうか? N
= 80 を帰無仮説, N ≠ 80 を対立仮説とします. 帰無仮説から帰無分布を作成し, 今回の事象がどの程度起こりうるものなのかを調べます. • 平均値:80×0.5=40 • 分散:80×0.5×0.5=20 • 標準偏差:2√5 表が出た枚数 50 を標準化します.
仮説検定をしよう 帰無分布に棄却域と呼ばれる領域を作ります. 棄却域は次のように作成します. 1. 帰無分布の端っこに作成する 2. 棄却域の合計が5%(左右2.5%ずつ)に なるように作成する この5%のことを有意水準と呼びます. 有意水準には5%の他に,
1%などを用いることもあります. なお, 標準正規分布において, 左右2.5%の棄却域の境目は ±1.96 です. (標準正規分布表を参照) 棄却域 棄却域
仮説検定をしよう 2.237… は 1.96 より大きいので棄却域に入っています. このとき, 次のように判断します. 今回のこの一連の作業のことを(仮説)検定と呼びます. 今回得られた「80枚中50枚表」という結果は帰無仮説 から予想される値とかけ離れすぎている.
これは, 「N=80」という帰無仮説自体が間違っている ということではないか. そのため, 対立仮説の方を採用し, 「N=80と考えるのは妥当でない(有意水準5%)」と 結論づけます. 棄却域 棄却域
仮説検定をしよう (表裏の出る確率が等しい)N 枚のコインを一斉に投げたところ, 表が 50 枚出ました. 問:Nとして 120 を考えることは妥当でしょうか? N
= 120 を帰無仮説, N ≠ 120 を対立仮説とします. 帰無仮説から帰無分布を作成します. • 平均値:120×0.5=60 • 分散:120×0.5×0.5=30 • 標準偏差:√30 -1.825 は -1.96 より大きいので, 棄却域に入っていません. そのため N=120 を棄却する証拠は得られませんでした. ※ N=120が妥当であるという結論が得られたわけではないことに注意しましょう.
まとめ • 標準正規分布表を用いることで, 正規分布に関する確率を求めることができ, これによって予測を行え ます. • データ x が平均値が
μ, 標準偏差が σ の正規分布のデータであるとき, 次の加工で得られたデータ z は標準正規分布のデータになります.(標準化) • 推測統計は標本のデータをもとに, 母集団の特徴を推測する学問です. • 標準正規分布を使った予測を逆用することで, 仮説検定を行うことができます. ◦ 標本(観測データ)を標準化し, 棄却域に入るかどうかチェックしましょう. ◦ 「棄却域に入り, 帰無仮説を棄却できた → 対立仮説が妥当だと結論づける」はOK! ◦ 「棄却域に入らず, 帰無仮説を棄却できなかった → 帰無仮説が妥当だと結論づける」はNG!
演習問題を解こう!