Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎3 分布と範囲
Search
xjorv
PRO
January 26, 2021
Education
0
210
統計の基礎3 分布と範囲
統計の基礎3では、データの分布とその範囲について説明します。
xjorv
PRO
January 26, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
PRO
0
4.1k
コンパートメントモデルをStanで解く
xjorv
PRO
0
260
生物学的同等性試験 検出力の計算法
xjorv
PRO
0
2.5k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
PRO
0
3.7k
粉体特性2
xjorv
PRO
0
1.9k
粉体特性1
xjorv
PRO
0
2.2k
皮膜5
xjorv
PRO
0
1.8k
皮膜4
xjorv
PRO
0
1.7k
皮膜3
xjorv
PRO
0
1.7k
Other Decks in Education
See All in Education
第1回全国商業高校Webアプリコンテスト総括
asial_corp
0
400
AI教育の未来『おもしろい』を作れる人材の育て方 #東京AI祭
o_ob
1
320
「小・中・高等学校における情報教育の体系的な学習を目指したカリキュラムモデル基本方針」
codeforeveryone
0
1.2k
前期教育実習事前指導0221
naradai
0
130
Project Sprint 学生版(入門編)
copilot
PRO
0
140
Switches
irocho
0
130
UniKL 2024 - Phishing Security Awareness: Malware
x86fatah
0
110
6 занятие. Четыре тактики метода "8 кубиков"бизнес-модели #ideaNN 1.03.2024.
karlov
0
140
Data Representation - Lecture 3 - Information Visualisation (4019538FNR)
signer
PRO
1
1.7k
リンゴゲームと貧富の差 / Origin of the disparity of wealth
kaityo256
PRO
12
13k
Introduction - Lecture 1 - Information Visualisation (4019538FNR)
signer
PRO
0
3.5k
LinkedIn
matleenalaakso
0
130
Featured
See All Featured
Happy Clients
brianwarren
91
6.3k
Writing Fast Ruby
sferik
619
60k
Building Effective Engineering Teams - LeadDev
addyosmani
25
1.8k
Code Reviewing Like a Champion
maltzj
513
39k
Debugging Ruby Performance
tmm1
69
11k
A Philosophy of Restraint
colly
195
15k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
18
1.7k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
6
980
Scaling GitHub
holman
456
140k
Build The Right Thing And Hit Your Dates
maggiecrowley
23
2k
Designing Experiences People Love
moore
135
23k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
Transcript
統計の基礎3 分布と範囲 2020/8/19 Ver. 1.0
データの範囲 分布を持つデータには範囲が存在する • データの範囲をどのように表現するのか? • 代表値となり得るものはなにか?
標準偏差 分散の平方根のこと s = 1 σ =1 ( − ҧ
)2 • ばらつきを表すときに最もよく使用される • データの範囲を反映したパラメータ
標準偏差と正規分布 標準偏差(σ)で範囲を表現する 赤は1σ 青は2σ 緑は3σ 1σに68%、2σに95%、3σに99.7%のデータ*が含まれる *おおよその値。σは母分散を表すときのギリシャ文字。母平均はμで示す
標準偏差とその他の分布 正規分布以外ではσとデータの関係は異なる 赤は1σ 青は2σ 緑は3σ • コーシーでは1σに50%、対数正規分布では正負で異なる 標準偏差だけではデータの範囲を把握できない
ヒストグラム、確率密度 図で表示すると理解しやすくなる • ヒストグラムは離散値、確率密度は連続値に使うことが多い *離散値: 整数のように、飛び飛びの数のこと、連続値: 少数を含む連続した数のこと
Quantile(分位)と中央値 中央値や4分位値は分布によらず範囲を反映する 縦線は左から 5%, 25%, 50%, 75%, 95% の分位点 25%、50%、75%を4分位値と呼ぶ
箱ひげ図 範囲の代表値を図に表したもの • 箱の中央線は中央値 • 箱の上端は第3、下端は第1四分位値 • 縦線は四分位から1.5×IQR*の長さの線 • 縦線の範囲外は外れ値
IQR: 中央値と四分位値の差
まとめ • 標準偏差はばらつきを示す代表値の一つ • 分布により、範囲の意味は異なる • 四分位は分布によらず範囲を示す代表値 • 箱ひげ図はデータの分布を示すのに適した図