Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎2 基礎統計量
Search
xjorv
January 25, 2021
Education
0
330
統計の基礎2 基礎統計量
統計の基礎2では、基礎統計量について説明します。
xjorv
January 25, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.8k
コンパートメントモデルをStanで解く
xjorv
0
470
生物学的同等性試験 検出力の計算法
xjorv
0
3.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.4k
粉体特性2
xjorv
0
2.5k
粉体特性1
xjorv
0
2.9k
皮膜5
xjorv
0
2.4k
皮膜4
xjorv
0
2.3k
皮膜3
xjorv
0
2.3k
Other Decks in Education
See All in Education
焦りと不安を、技術力に変える方法 - 新卒iOSエンジニアの失敗談と成長のフレームワーク
hypebeans
1
570
Human Perception and Cognition - Lecture 4 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.2k
Réaliser un diagnostic externe
martine
0
600
データで見る赤ちゃんの成長
syuchimu
0
360
1008
cbtlibrary
0
100
✅ レポート採点基準 / How Your Reports Are Assessed
yasslab
PRO
0
140
RGBでも蛍光を!? / RayTracingCamp11
kugimasa
1
200
多様なメンター、多様な基準
yasulab
PRO
5
19k
~キャラ付け考えていますか?~ AI時代だからこそ技術者に求められるセルフブランディングのすゝめ
masakiokuda
7
530
生成AIとの付き合い方 / Generative AI and us
kaityo256
PRO
11
6.1k
Web 2.0 Patterns and Technologies - Lecture 8 - Web Technologies (1019888BNR)
signer
PRO
0
2.9k
附属科学技術高等学校の概要|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
2.6k
Featured
See All Featured
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Speed Design
sergeychernyshev
33
1.3k
For a Future-Friendly Web
brad_frost
180
10k
Documentation Writing (for coders)
carmenintech
76
5.2k
Statistics for Hackers
jakevdp
799
230k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
Building Adaptive Systems
keathley
44
2.9k
Agile that works and the tools we love
rasmusluckow
331
21k
Docker and Python
trallard
46
3.7k
Rails Girls Zürich Keynote
gr2m
95
14k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
690
Transcript
統計の基礎2 基礎統計量 2020/8/18 Ver. 1.0
基礎統計量とは? 平均値、分散、標準偏差などの値のこと • 数の集合に対して適用し、計算するもの • 平均や標準偏差は正規分布するデータに有効
平均値 標本の和を標本数で割ったもの ҧ = σ =1 n • 最もよく用いられる代表値の一つ •
正規分布では代表値として適している * ҧ は平均を表すときによく使われる表現
中央値 データを数値順に並べ、ちょうど真ん中にくる値のこと • 対数正規分布などの代表値としては適切 • 平均値よりは分布の歪みに強い • 年収などの代表値として用いられる
最頻値 ヒストグラムにしたとき、最も数が多くなる値のこと • 平均値よりは分布の歪みに強い • 平均値・中央値ほどには使用されない
平均・中央・最頻値の選択 左は正規分布、右は対数正規分布 分布の形により、代表値の適正が異なる 赤が平均 青が中央 緑が最頻
分散 標本のばらつきを示す指標の一つ 2 = 1 =1 ( − ҧ
)2 • 個々の値と平均の差の二乗和を標本数で割ったもの • 標準偏差の二乗にあたる
母分散と不偏分散 標本の分散は不偏分散と呼ばれる 2 = 1 − 1 =1 (
− ҧ )2 • 標本分散は母分散よりやや大きくなる • n-1個の情報が決まると、n個目のデータは一意的に決まる から1を引く、とよく説明される * データを実際に計算機で操作するときには不偏分散を使っているときが多いので、気にする必要はそれほど高くない https://stats.biopapyrus.jp/stats/var.html
標準偏差 分散の平方根のこと s = 1 -1 σ =1 ( −
ҧ )2 • ばらつきを表すときに最もよく使用される
標準誤差 s = 1 1 -1 σ =1 ( −
ҧ )2 標準偏差を標本数の平方根で割ったもの • 平均値の推定範囲を示す • 平均に注目したデータで用いる • ばらつきを意味するパラメータではない
共分散 対応する2つのデータの偏差の積のこと = 1 -1 =1 ( − ҧ
) − ത • 共分散を単独で使用する場合は少ない • 相関係数や共分散分析の計算に用いる
相関係数 対応する2つのデータの関係性を示す値 = ∙ • 共分散を個別の標準偏差で割ったもの • -1~1の値を取る • 絶対値が1に近いほど相関が強い
r: 相関係数、s x : 変数xの標準偏差、s y : 変数yの標準偏差、s xy : 共分散
r=-0.600 r=0.09 r=0.604 相関係数とデータ r=0.954 r=-0.950 +は正の相関、-は負の相関を示す • r2は決定係数で、回帰に関係するパラメータ •
相関係数は2値の関係を示すパラメータ