Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎14 正規性、等分散性、外れ値の検定
Search
xjorv
February 06, 2021
Education
0
880
統計の基礎14 正規性、等分散性、外れ値の検定
統計の基礎14では正規性、等分散性、外れ値の検定について説明します。
xjorv
February 06, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.8k
コンパートメントモデルをStanで解く
xjorv
0
470
生物学的同等性試験 検出力の計算法
xjorv
0
3.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.4k
粉体特性2
xjorv
0
2.5k
粉体特性1
xjorv
0
2.9k
皮膜5
xjorv
0
2.4k
皮膜4
xjorv
0
2.3k
皮膜3
xjorv
0
2.3k
Other Decks in Education
See All in Education
子どものためのプログラミング道場『CoderDojo』〜法人提携例〜 / Partnership with CoderDojo Japan
coderdojojapan
4
17k
ハッカソンを活用したモノづくり教育について
yusk1450
PRO
2
120
焦りと不安を、技術力に変える方法 - 新卒iOSエンジニアの失敗談と成長のフレームワーク
hypebeans
1
450
中央教育審議会 教育課程企画特別部会 情報・技術ワーキンググループに向けた提言 ー次期学習指導要領での情報活用能力の抜本的向上に向けてー
codeforeveryone
0
400
子どもが自立した学習者となるデジタルの活用について
naokikato
PRO
0
140
中間活動報告会 人材育成WG・技術サブWG / 20250808-oidfj-eduWG-techSWG
oidfj
0
840
20250830_本社にみんなの公園を作ってみた
yoneyan
0
150
探査機自作ゼミ2025スライド
sksat
3
840
生成AIとの付き合い方 / Generative AI and us
kaityo256
PRO
11
4.2k
SISTEMA DE MEMORIA Y SU IMPACTO EN LAS DECISIONES.
jvpcubias
0
190
~キャラ付け考えていますか?~ AI時代だからこそ技術者に求められるセルフブランディングのすゝめ
masakiokuda
7
520
Test-NUTMEG紹介スライド
mugiiicha
0
330
Featured
See All Featured
Become a Pro
speakerdeck
PRO
29
5.6k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Optimizing for Happiness
mojombo
379
70k
Writing Fast Ruby
sferik
630
62k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
A Modern Web Designer's Workflow
chriscoyier
697
190k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
The Cult of Friendly URLs
andyhume
79
6.7k
Site-Speed That Sticks
csswizardry
13
970
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
330
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
Transcript
統計の基礎14 正規性・等分散性・外れ値の検定 2021/1/14 Ver. 1.0
正規性・等分散性・外れ値の検定とは? 統計にパラメトリックな手法を使えることを確認する • 正規性・等分散性がパラメトリック手法の前提条件 • 正規性・等分散性がなければノンパラメトリック*を使う • 検定で外れ値であることを確認する *t検定などは頑強性があるため、正規性がなくても使ってよいとされている場合もある https://norimune.net/1761
正規性の検定 2種類の方法で検証するのが一般的 • q-qプロット • Shapiro-Wilk検定 お作法的にはパラメトリック検定前に 行うのが良いとされている *t検定、分散分析、カイ2乗分析など、測定値の正規性を背景においている検定はパラメトリックな手法とされる
q-q プロット 測定値と正規分布の分位値の相関を取ったグラフのこと 対数正規乱数のq-qプロット 正規乱数のq-qプロット 対数正規乱数 正規乱数 正規分布の分位値 正規分布していると、原点を通る直線に乗る *外れ値が見つかることがあるが、分布に依存している可能性もある
Shapiro-Wilk検定 帰無仮説が正規分布しているとする検定のこと • 帰無仮説が棄却されれば、正規分布しないことになる • 例数が増えると、棄却されやすくなる 対数正規乱数で検定 正規乱数で検定 *Kolmogorov-Smirnov検定というもので2つの分布間の違いを検定することもある
等分散性の検定 群間で分散が同じであることを検定する方法 • Bartlettの検定 • 2標本分散のF検定 • パラメトリック検定前に行うのが良いとされている • F検定は2群、Bartlettは3群以上の比較に用いる
*有意差が見られれば分散は同一ではないため、ノンパラメトリックを使ったほうがよいとされる
外れ値の検定 群が正規分布に従うとしたとき、外れ値を検定する方法 • Smirnov-Grubbs検定 • Thompson検定 • 最大値が外れ値であるかどうか検定する • 正規分布しない場合には信頼性がない
• 外れ値だからといって統計的に除外してよいわけではない *サンプルが少なければまず除外はできない
まとめ • 正規性を前提とする場合、正規性・等分散性の検定を利用 できる • 正規性があれば外れ値を検定により検出することはできる • いずれもそれほど高頻度には用いられない