Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
仮説検定の例(補足資料)
Search
nonki1974
July 08, 2017
Science
0
190
仮説検定の例(補足資料)
講義で使った資料です
nonki1974
July 08, 2017
Tweet
Share
More Decks by nonki1974
See All by nonki1974
GTFS with Tidytransit package
nonki1974
0
310
TokyoR#84_Rexams
nonki1974
0
200
都道府県別焼き鳥屋ランキングの作成
nonki1974
1
890
Introduction to R
nonki1974
0
340
Introduction to dplyr
nonki1974
0
480
Introduction to ggplot2
nonki1974
1
500
Analyzing PSB tracks with R
nonki1974
0
590
introduction to fukuoka.R @ Fukuoka.LT
nonki1974
0
62
所要時間のヒートマップを作成する
nonki1974
0
540
Other Decks in Science
See All in Science
Ignite の1年間の軌跡
ktombow
0
160
データマイニング - ノードの中心性
trycycle
PRO
0
280
Celebrate UTIG: Staff and Student Awards 2025
utig
0
260
2025-06-11-ai_belgium
sofievl
1
170
機械学習 - pandas入門
trycycle
PRO
0
330
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
360
データベース05: SQL(2/3) 結合質問
trycycle
PRO
0
820
DMMにおけるABテスト検証設計の工夫
xc6da
1
1.1k
機械学習 - K近傍法 & 機械学習のお作法
trycycle
PRO
0
1.2k
機械学習 - K-means & 階層的クラスタリング
trycycle
PRO
0
1.1k
Hakonwa-Quaternion
hiranabe
1
140
データベース15: ビッグデータ時代のデータベース
trycycle
PRO
0
360
Featured
See All Featured
Code Review Best Practice
trishagee
72
19k
The Straight Up "How To Draw Better" Workshop
denniskardys
238
140k
Six Lessons from altMBA
skipperchong
28
4k
Fireside Chat
paigeccino
40
3.7k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Side Projects
sachag
455
43k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
870
4 Signs Your Business is Dying
shpigford
185
22k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
61k
Transcript
仮説検定の例(補足資料) @nonki1974
例|平成26年 国民健康・栄養調査 20歳~29歳の1日あたりのエネルギー摂取量 平均:1662kcal 標準偏差:480kcal 500 1000 1500 2000 2500
3000 0e+00 4e-04 8e-04 摂取カロリー[kcal] f(x) 研究者Aさんの主張 F女子大の学生の摂取カロリーは 全国の平均と異なるのではないか?
例|10名をランダムに抽出 F女子大の学生の摂取カロリーが 全国と同じ分布 (1662, 4802) だとすると、 10名分の平均値の分布は , となるはずだ! 500
1000 1500 2000 2500 3000 0.0000 0.0010 0.0020 0.0030 摂取カロリー[kcal] f(x) 実際に調べたら1300kcalだった この分布の下では起こりにくい
起こりにくさの評価 1300kcal は 1662kcal から 362kcal 離れている 10名の平均が1662kcalから362kcal以上ずれる確率 362 362
実際に得た値 仮定した値 ത − 1662 ≥ 362 = 2 ത ≤ 1300 = 0.017 1.7% これは起こりにくい! p値(p-value)
どれくらい小さければ起こりにくいか 例えば5%にする → 有意水準 1662 − 1.96 × 480 10
1662 + 1.96 × 480 10 実際に得た値が (棄却域) に入ったら、 起こりにくいことが起こった!と判断しよう 棄却域 棄却域 判定 基準
起こりにくいことが起こらないケース 実際に調べたら1800kcalだった 10名の平均が1662kcalから138kcal以上ずれる確率 ത − 1662 ≥ 138 = 2
ത ≤ 1524 = 0.363 36.3% 1662kcalが正しくても それなりに起こり得る! Aさんの主張の根拠として不十分
問題設定の定式化 研究者Aさんの主張 F女子大の学生の摂取カロリーは 全国の平均と異なるのではないか? F女子大の学生の摂取カロリーの平均を とし、 その分布は (, 2) とする
1 : ≠ 1662 対立仮説 0 : = 1662 帰無仮説 基準となる分布を作るための仮説
仮説検定の流れ 帰無仮説0 と対立仮説1 を設定する 帰無仮説0 の下で統計量の確率分布を求める 棄却域を設定し、統計量の実現値が 棄却域に入るかどうかを判定 統計量の実現値のp値を計算し、 有意水準よりも小さいかどうかを判定
1 2 3 3’ 3 3’ はいずれかでOK
判定結果の記述 4 0 の下では起こりにくいことが 起こったから・・・・ Case A 統計量の実現値が棄却域に入った もしくは p値が有意水準より小さい
を棄却する もしくは を採択する 0 の下では起こりうることが 起こったから・・・・ Case B 統計量の実現値が棄却域に入らず もしくは p値が有意水準より大きい を受容する もしくは 0 を棄却できない
対立仮説の種類 | 右側仮説 研究者Aさんの主張 F女子大の学生の摂取カロリーは 全国の平均より多いのではないか? 1 : > 1662
右側仮説 1662 + 1.645 × 480 10 棄却域 5%
対立仮説の種類 | 左側仮説 研究者Aさんの主張 F女子大の学生の摂取カロリーは 全国の平均より少ないのではないか? 1 : < 1662
左側仮説 1662 − 1.645 × 480 10 5% 棄却域