Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎2 基礎統計量
Search
xjorv
January 25, 2021
Education
0
320
統計の基礎2 基礎統計量
統計の基礎2では、基礎統計量について説明します。
xjorv
January 25, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.6k
コンパートメントモデルをStanで解く
xjorv
0
440
生物学的同等性試験 検出力の計算法
xjorv
0
3.5k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.2k
粉体特性2
xjorv
0
2.5k
粉体特性1
xjorv
0
2.8k
皮膜5
xjorv
0
2.3k
皮膜4
xjorv
0
2.2k
皮膜3
xjorv
0
2.2k
Other Decks in Education
See All in Education
AI for Learning
fonylew
0
180
生成AIとの上手な付き合い方【公開版】/ How to Get Along Well with Generative AI (Public Version)
handlename
0
570
データ分析
takenawa
0
12k
Dashboards - Lecture 11 - Information Visualisation (4019538FNR)
signer
PRO
1
2.1k
『会社を知ってもらう』から『安心して活躍してもらう』までの プロセスとフロー
sasakendayo
0
250
Alumnote inc. Company Deck
yukinumata
0
1.2k
新卒研修に仕掛ける 学びのサイクル / Implementing Learning Cycles in New Graduate Training
takashi_toyosaki
1
200
2025年度春学期 統計学 第5回 分布をまとめるー記述統計量(平均・分散など) (2025. 5. 8)
akiraasano
PRO
0
200
【品女100周年企画】Pitch Deck
shinagawajoshigakuin_100th
0
4.6k
人になにかを教えるときに考えていること(2025-05版 / VRC-LT #18)
sksat
4
1.1k
バックオフィス組織にも「チームトポロジー」の考えが使えるかもしれない!!
masakiokuda
0
120
Open Source Summit Japan 2025のボランティアをしませんか
kujiraitakahiro
0
790
Featured
See All Featured
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
332
22k
Building Adaptive Systems
keathley
43
2.7k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
How STYLIGHT went responsive
nonsquared
100
5.7k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
A better future with KSS
kneath
239
17k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
47
9.6k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.4k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
How to Think Like a Performance Engineer
csswizardry
25
1.8k
Transcript
統計の基礎2 基礎統計量 2020/8/18 Ver. 1.0
基礎統計量とは? 平均値、分散、標準偏差などの値のこと • 数の集合に対して適用し、計算するもの • 平均や標準偏差は正規分布するデータに有効
平均値 標本の和を標本数で割ったもの ҧ = σ =1 n • 最もよく用いられる代表値の一つ •
正規分布では代表値として適している * ҧ は平均を表すときによく使われる表現
中央値 データを数値順に並べ、ちょうど真ん中にくる値のこと • 対数正規分布などの代表値としては適切 • 平均値よりは分布の歪みに強い • 年収などの代表値として用いられる
最頻値 ヒストグラムにしたとき、最も数が多くなる値のこと • 平均値よりは分布の歪みに強い • 平均値・中央値ほどには使用されない
平均・中央・最頻値の選択 左は正規分布、右は対数正規分布 分布の形により、代表値の適正が異なる 赤が平均 青が中央 緑が最頻
分散 標本のばらつきを示す指標の一つ 2 = 1 =1 ( − ҧ
)2 • 個々の値と平均の差の二乗和を標本数で割ったもの • 標準偏差の二乗にあたる
母分散と不偏分散 標本の分散は不偏分散と呼ばれる 2 = 1 − 1 =1 (
− ҧ )2 • 標本分散は母分散よりやや大きくなる • n-1個の情報が決まると、n個目のデータは一意的に決まる から1を引く、とよく説明される * データを実際に計算機で操作するときには不偏分散を使っているときが多いので、気にする必要はそれほど高くない https://stats.biopapyrus.jp/stats/var.html
標準偏差 分散の平方根のこと s = 1 -1 σ =1 ( −
ҧ )2 • ばらつきを表すときに最もよく使用される
標準誤差 s = 1 1 -1 σ =1 ( −
ҧ )2 標準偏差を標本数の平方根で割ったもの • 平均値の推定範囲を示す • 平均に注目したデータで用いる • ばらつきを意味するパラメータではない
共分散 対応する2つのデータの偏差の積のこと = 1 -1 =1 ( − ҧ
) − ത • 共分散を単独で使用する場合は少ない • 相関係数や共分散分析の計算に用いる
相関係数 対応する2つのデータの関係性を示す値 = ∙ • 共分散を個別の標準偏差で割ったもの • -1~1の値を取る • 絶対値が1に近いほど相関が強い
r: 相関係数、s x : 変数xの標準偏差、s y : 変数yの標準偏差、s xy : 共分散
r=-0.600 r=0.09 r=0.604 相関係数とデータ r=0.954 r=-0.950 +は正の相関、-は負の相関を示す • r2は決定係数で、回帰に関係するパラメータ •
相関係数は2値の関係を示すパラメータ