Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
第9回統計勉強会.pdf
Search
Haruhisa Kimoto
November 26, 2023
0
26
第9回統計勉強会.pdf
Haruhisa Kimoto
November 26, 2023
Tweet
Share
More Decks by Haruhisa Kimoto
See All by Haruhisa Kimoto
第1回統計勉強会.pdf
haru0805
0
20
第1回統計モデル勉強会.pdf
haru0805
0
39
LLM勉強会_vol.7_大規模言語モデルの進展.pdf
haru0805
0
23
特徴量エンジニアリング_vol.1.pdf
haru0805
1
41
Featured
See All Featured
The Illustrated Children's Guide to Kubernetes
chrisshort
48
51k
How STYLIGHT went responsive
nonsquared
100
5.8k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
850
GitHub's CSS Performance
jonrohan
1032
460k
How to Ace a Technical Interview
jacobian
280
23k
Code Review Best Practice
trishagee
72
19k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.2k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
Transcript
https://www.academix.jp/ AcademiX 統計勉強会 統計勉強会 vol.9 茨城大学工学部情報工学科 木本晴久(Kimoto Haruhisa) 2023/05/07
複数の質的な変量に対する多変量データから、 変数の値の組み合わせごとの頻度を集計して表にしたもの 2 分割表
分割表 ある疾病の治療のために開発された新薬の効果を調べる 3 効果あり 効果なし 計 新薬 16 4 20
従来薬 12 8 20 計 28 12 20 分割表における 変量 → 「因子」 処方薬・改善度 因子の取りうる値 → 「水準」 新薬・従来薬
分割表の種類 2元分割表 2×2分割表 : {新薬, 従来薬} {あり, なし} 2×3分割表 :
{新薬, 従来薬} {大きな効果, やや効果あり, あり効果なし} 3元分割表 2×3×4分割表 : {新薬, 従来薬} {大きな効果, ありやや効果, あり効果なし} {20代以下, 30代, 40代, 50代以上} 4
今回説明する分析手法 • 各因子が2水準の場合 • 3水準以上であっても、水準に順序のない場合 5
2群の比較 新薬であるか従来薬であるかの事象: A 改善度が効果あるかないかの事象 : B 標本サイズ : n 上記のようにおくと、独立な二項分布と考えることができる。 二項分布の正規確率θ1, θ2は、各群で改善度が「効果ありとなる確率」 考えたいことは「群ごとの二項分布の生起確率の違い」
6 観測値 B1 B2 計 A1 x1 n1 - x1 n1 A2 x2 n2 - x2 n2 確率 B1 B2 計 A1 θ1 1 - θ1 1 A2 θ2 1 - θ2 1
オッズ比 オッズ:確率の比 オッズ比:2つの二項確率のオッズの比 7
前向き研究と後ろ向き研究 ・前向き研究 将来生じる現象を調査する ・後ろ向き研究 過去に生じた現象を調査する ◦前向き研究の方が後ろ向き研究よりも信頼性が高い。 後ろ向き研究は選択バイアスが入る余地があるため。 ◦前向き研究が不可能な場合に後ろ向き研究を行う。 例:喫煙習慣と肺がんの関係 8
母数の推定 母数θの自然な点推定は、 このθは最尤推定量であり、不偏推定量である。 二項分布の性質から、様々な推定量と信頼区間が導出できる。 9
2群の一様性の仮説 10 p6で考えたい「群ごとの二項分布の生起確率の違い」を両側検定で 検証する場合、帰無仮説と対立仮説は、 この帰無仮説は、「2群の一様性の仮説」と呼ばれる。
2群の一様性の仮説の代表的な検定 ・適合度カイ二乗分布 ・尤度比検定 ・フィッシャーの正確検定 11
適合度カイ二乗分布・尤度比検定 12 • 帰無仮説と対立仮説のそれぞれのもとで母数の最尤推定量を求める。 • それぞれの仮説のもとで、当てはめ値を求める。 当てはめ値:各セルの頻度に対応する確率変数の期待値の最尤推定量として定 義される。 ◦適合度カイ二乗分布 帰無仮説のもとでの当てはめ値と対立仮説のもとでの当てはめ値から定義され
る。 ◦尤度比検定 尤度関数にそれぞれの仮説のもとでの母数の尤度推定量を代入したものの比を 取ることで得られる。
フィッシャーの正確検定 カイ二乗検定では、カイ二乗値を計算し、得られたカイ二乗値をカイ二乗分布表と見比べた。 → 「P値を正確に計算するのではなく、近似したP値を得る方法」 フィッシャーの正確確率検定では、P値を「正確に」計算する。 ◦適合度カイ二乗分布・尤度比検定と違い、漸近分布論を使わない検定手法として広く利用されている。 データ数が少ないときにでも使用することができる! 13
参考文献 ・日本統計学会公式認定 統計検定準1級対応 「統計学実践ワークブック」 ・統計WEB https://bellcurve.jp/statistics/ ・https://best-biostatistics.com/design/forward-back.html 14