Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎14 正規性、等分散性、外れ値の検定
Search
xjorv
February 06, 2021
Education
0
890
統計の基礎14 正規性、等分散性、外れ値の検定
統計の基礎14では正規性、等分散性、外れ値の検定について説明します。
xjorv
February 06, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.9k
コンパートメントモデルをStanで解く
xjorv
0
480
生物学的同等性試験 検出力の計算法
xjorv
0
3.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.4k
粉体特性2
xjorv
0
2.5k
粉体特性1
xjorv
0
2.9k
皮膜5
xjorv
0
2.4k
皮膜4
xjorv
0
2.3k
皮膜3
xjorv
0
2.3k
Other Decks in Education
See All in Education
Library Prefects 2025-2026
cbtlibrary
0
180
1008
cbtlibrary
0
120
【洋書和訳:さよならを待つふたりのために】第2章 ガン特典と実存的フリースロー
yaginumatti
0
110
沖ハック~のみぞうさんとハッキングチャレンジ☆~
nomizone
1
540
the difficulty into words
ukky86
0
340
多様なメンター、多様な基準
yasulab
5
19k
Adobe Express
matleenalaakso
1
8.1k
心理学を学び活用することで偉大なスクラムマスターを目指す − 大学とコミュニティを組み合わせた学びの循環 / Becoming a great Scrum Master by learning and using psychology
psj59129
1
630
QR-koodit opetuksessa
matleenalaakso
0
1.8k
外国籍エンジニアの挑戦・新卒半年後、気づきと成長の物語
hypebeans
0
690
Design Guidelines and Models - Lecture 5 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.2k
あなたの言葉に力を与える、演繹的なアプローチ
logica0419
1
250
Featured
See All Featured
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
1
880
HDC tutorial
michielstock
1
290
Embracing the Ebb and Flow
colly
88
4.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
80
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
65
We Are The Robots
honzajavorek
0
130
The Invisible Side of Design
smashingmag
302
51k
How GitHub (no longer) Works
holman
316
140k
WENDY [Excerpt]
tessaabrams
9
35k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
0
37
Transcript
統計の基礎14 正規性・等分散性・外れ値の検定 2021/1/14 Ver. 1.0
正規性・等分散性・外れ値の検定とは? 統計にパラメトリックな手法を使えることを確認する • 正規性・等分散性がパラメトリック手法の前提条件 • 正規性・等分散性がなければノンパラメトリック*を使う • 検定で外れ値であることを確認する *t検定などは頑強性があるため、正規性がなくても使ってよいとされている場合もある https://norimune.net/1761
正規性の検定 2種類の方法で検証するのが一般的 • q-qプロット • Shapiro-Wilk検定 お作法的にはパラメトリック検定前に 行うのが良いとされている *t検定、分散分析、カイ2乗分析など、測定値の正規性を背景においている検定はパラメトリックな手法とされる
q-q プロット 測定値と正規分布の分位値の相関を取ったグラフのこと 対数正規乱数のq-qプロット 正規乱数のq-qプロット 対数正規乱数 正規乱数 正規分布の分位値 正規分布していると、原点を通る直線に乗る *外れ値が見つかることがあるが、分布に依存している可能性もある
Shapiro-Wilk検定 帰無仮説が正規分布しているとする検定のこと • 帰無仮説が棄却されれば、正規分布しないことになる • 例数が増えると、棄却されやすくなる 対数正規乱数で検定 正規乱数で検定 *Kolmogorov-Smirnov検定というもので2つの分布間の違いを検定することもある
等分散性の検定 群間で分散が同じであることを検定する方法 • Bartlettの検定 • 2標本分散のF検定 • パラメトリック検定前に行うのが良いとされている • F検定は2群、Bartlettは3群以上の比較に用いる
*有意差が見られれば分散は同一ではないため、ノンパラメトリックを使ったほうがよいとされる
外れ値の検定 群が正規分布に従うとしたとき、外れ値を検定する方法 • Smirnov-Grubbs検定 • Thompson検定 • 最大値が外れ値であるかどうか検定する • 正規分布しない場合には信頼性がない
• 外れ値だからといって統計的に除外してよいわけではない *サンプルが少なければまず除外はできない
まとめ • 正規性を前提とする場合、正規性・等分散性の検定を利用 できる • 正規性があれば外れ値を検定により検出することはできる • いずれもそれほど高頻度には用いられない