Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎14 正規性、等分散性、外れ値の検定
Search
xjorv
February 06, 2021
Education
0
890
統計の基礎14 正規性、等分散性、外れ値の検定
統計の基礎14では正規性、等分散性、外れ値の検定について説明します。
xjorv
February 06, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.8k
コンパートメントモデルをStanで解く
xjorv
0
480
生物学的同等性試験 検出力の計算法
xjorv
0
3.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.4k
粉体特性2
xjorv
0
2.5k
粉体特性1
xjorv
0
2.9k
皮膜5
xjorv
0
2.4k
皮膜4
xjorv
0
2.3k
皮膜3
xjorv
0
2.3k
Other Decks in Education
See All in Education
東大1年生にJulia教えてみた
matsui_528
7
11k
いわゆる「ふつう」のキャリアを歩んだ人の割合(若者向け)
hysmrk
0
290
the difficulty into words
ukky86
0
330
仏教の源流からの奈良県中南和_奈良まほろば館‗飛鳥・藤原DAO/asuka-fujiwara_Saraswati
tkimura12
0
170
卒論の書き方 / Happy Writing
kaityo256
PRO
51
27k
焦りと不安を、技術力に変える方法 - 新卒iOSエンジニアの失敗談と成長のフレームワーク
hypebeans
1
620
Software
irocho
0
650
QR-koodit opetuksessa
matleenalaakso
0
1.8k
Surviving the surfaceless web
jonoalderson
0
120
【dip】「なりたい自分」に近づくための、「自分と向き合う」小さな振り返り
dip_tech
PRO
0
200
ロータリー国際大会について~国際大会に参加しよう~:古賀 真由美 会員(2720 Japan O.K. ロータリーEクラブ・(有)誠邦産業 取締役)
2720japanoke
1
750
XML and Related Technologies - Lecture 7 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
Featured
See All Featured
The Invisible Side of Design
smashingmag
302
51k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.1k
A Soul's Torment
seathinner
1
2k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
94
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
30
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.2k
GraphQLとの向き合い方2022年版
quramy
50
14k
Embracing the Ebb and Flow
colly
88
4.9k
Code Review Best Practice
trishagee
74
19k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
92
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
130
The untapped power of vector embeddings
frankvandijk
1
1.5k
Transcript
統計の基礎14 正規性・等分散性・外れ値の検定 2021/1/14 Ver. 1.0
正規性・等分散性・外れ値の検定とは? 統計にパラメトリックな手法を使えることを確認する • 正規性・等分散性がパラメトリック手法の前提条件 • 正規性・等分散性がなければノンパラメトリック*を使う • 検定で外れ値であることを確認する *t検定などは頑強性があるため、正規性がなくても使ってよいとされている場合もある https://norimune.net/1761
正規性の検定 2種類の方法で検証するのが一般的 • q-qプロット • Shapiro-Wilk検定 お作法的にはパラメトリック検定前に 行うのが良いとされている *t検定、分散分析、カイ2乗分析など、測定値の正規性を背景においている検定はパラメトリックな手法とされる
q-q プロット 測定値と正規分布の分位値の相関を取ったグラフのこと 対数正規乱数のq-qプロット 正規乱数のq-qプロット 対数正規乱数 正規乱数 正規分布の分位値 正規分布していると、原点を通る直線に乗る *外れ値が見つかることがあるが、分布に依存している可能性もある
Shapiro-Wilk検定 帰無仮説が正規分布しているとする検定のこと • 帰無仮説が棄却されれば、正規分布しないことになる • 例数が増えると、棄却されやすくなる 対数正規乱数で検定 正規乱数で検定 *Kolmogorov-Smirnov検定というもので2つの分布間の違いを検定することもある
等分散性の検定 群間で分散が同じであることを検定する方法 • Bartlettの検定 • 2標本分散のF検定 • パラメトリック検定前に行うのが良いとされている • F検定は2群、Bartlettは3群以上の比較に用いる
*有意差が見られれば分散は同一ではないため、ノンパラメトリックを使ったほうがよいとされる
外れ値の検定 群が正規分布に従うとしたとき、外れ値を検定する方法 • Smirnov-Grubbs検定 • Thompson検定 • 最大値が外れ値であるかどうか検定する • 正規分布しない場合には信頼性がない
• 外れ値だからといって統計的に除外してよいわけではない *サンプルが少なければまず除外はできない
まとめ • 正規性を前提とする場合、正規性・等分散性の検定を利用 できる • 正規性があれば外れ値を検定により検出することはできる • いずれもそれほど高頻度には用いられない