Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎14 正規性、等分散性、外れ値の検定
Search
xjorv
February 06, 2021
Education
0
890
統計の基礎14 正規性、等分散性、外れ値の検定
統計の基礎14では正規性、等分散性、外れ値の検定について説明します。
xjorv
February 06, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.9k
コンパートメントモデルをStanで解く
xjorv
0
480
生物学的同等性試験 検出力の計算法
xjorv
0
3.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.5k
粉体特性2
xjorv
0
2.6k
粉体特性1
xjorv
0
2.9k
皮膜5
xjorv
0
2.4k
皮膜4
xjorv
0
2.3k
皮膜3
xjorv
0
2.3k
Other Decks in Education
See All in Education
【洋書和訳:さよならを待つふたりのために】第2章 ガン特典と実存的フリースロー
yaginumatti
0
200
1021
cbtlibrary
0
400
【dip】「なりたい自分」に近づくための、「自分と向き合う」小さな振り返り
dip_tech
PRO
0
220
IHLヘルスケアリーダーシップ研究会17期説明資料
ihlhealthcareleadership
0
750
Introdución ás redes
irocho
0
530
Linguaxes de programación
irocho
0
520
10分で学ぶ すてきなモナド
soukouki
1
140
多様なメンター、多様な基準
yasulab
PRO
5
19k
令和エンジニアの学習法 〜 生成AIを使って挫折を回避する 〜
moriga_yuduru
0
230
【旧:ZEPメタバース校舎操作ガイド】
ainischool
0
780
1202
cbtlibrary
0
200
AWS re_Invent に全力で参加したくて筋トレを頑張っている話
amarelo_n24
2
120
Featured
See All Featured
Context Engineering - Making Every Token Count
addyosmani
9
640
ラッコキーワード サービス紹介資料
rakko
1
2.2M
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.8k
sira's awesome portfolio website redesign presentation
elsirapls
0
140
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
400
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
150
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
51
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
3.9k
Done Done
chrislema
186
16k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
61
Transcript
統計の基礎14 正規性・等分散性・外れ値の検定 2021/1/14 Ver. 1.0
正規性・等分散性・外れ値の検定とは? 統計にパラメトリックな手法を使えることを確認する • 正規性・等分散性がパラメトリック手法の前提条件 • 正規性・等分散性がなければノンパラメトリック*を使う • 検定で外れ値であることを確認する *t検定などは頑強性があるため、正規性がなくても使ってよいとされている場合もある https://norimune.net/1761
正規性の検定 2種類の方法で検証するのが一般的 • q-qプロット • Shapiro-Wilk検定 お作法的にはパラメトリック検定前に 行うのが良いとされている *t検定、分散分析、カイ2乗分析など、測定値の正規性を背景においている検定はパラメトリックな手法とされる
q-q プロット 測定値と正規分布の分位値の相関を取ったグラフのこと 対数正規乱数のq-qプロット 正規乱数のq-qプロット 対数正規乱数 正規乱数 正規分布の分位値 正規分布していると、原点を通る直線に乗る *外れ値が見つかることがあるが、分布に依存している可能性もある
Shapiro-Wilk検定 帰無仮説が正規分布しているとする検定のこと • 帰無仮説が棄却されれば、正規分布しないことになる • 例数が増えると、棄却されやすくなる 対数正規乱数で検定 正規乱数で検定 *Kolmogorov-Smirnov検定というもので2つの分布間の違いを検定することもある
等分散性の検定 群間で分散が同じであることを検定する方法 • Bartlettの検定 • 2標本分散のF検定 • パラメトリック検定前に行うのが良いとされている • F検定は2群、Bartlettは3群以上の比較に用いる
*有意差が見られれば分散は同一ではないため、ノンパラメトリックを使ったほうがよいとされる
外れ値の検定 群が正規分布に従うとしたとき、外れ値を検定する方法 • Smirnov-Grubbs検定 • Thompson検定 • 最大値が外れ値であるかどうか検定する • 正規分布しない場合には信頼性がない
• 外れ値だからといって統計的に除外してよいわけではない *サンプルが少なければまず除外はできない
まとめ • 正規性を前提とする場合、正規性・等分散性の検定を利用 できる • 正規性があれば外れ値を検定により検出することはできる • いずれもそれほど高頻度には用いられない