Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎1
Search
xjorv
PRO
January 24, 2021
Education
0
290
統計の基礎1
統計の基礎1では、確率論と統計の関係、データの分布、回帰について説明します。
xjorv
PRO
January 24, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
PRO
0
4k
コンパートメントモデルをStanで解く
xjorv
PRO
0
250
生物学的同等性試験 検出力の計算法
xjorv
PRO
0
2.5k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
PRO
0
3.7k
粉体特性2
xjorv
PRO
0
1.9k
粉体特性1
xjorv
PRO
0
2.2k
皮膜5
xjorv
PRO
0
1.8k
皮膜4
xjorv
PRO
0
1.7k
皮膜3
xjorv
PRO
0
1.7k
Other Decks in Education
See All in Education
Ch5_-_Partie_2.pdf
bernhardsvt
0
140
Animaatiot opetuksessa
matleenalaakso
0
3.1k
応用セッション_同じデータでもP値が変わる話/key_considerations_in_NHST_2
florets1
1
830
情報Iの「縦糸」と「横糸」を意識したプログラム教育の実践
asial_edu
0
160
渡辺研Slackの使い方 / Slack Local Rule
kaityo256
PRO
5
5.3k
Multimodal Interaction - Lecture 3 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1k
Digijulkaisut
matleenalaakso
1
8.5k
自己紹介 / who-am-i
yasulab
2
3k
AWS試験全冠したら新しい道が開けた話
nagisa53
3
1k
Design Guidelines and Principles - Lecture 7 - Information Visualisation (4019538FNR)
signer
PRO
0
1.6k
UniKL 2024 - Phishing Security Awareness: Malware
x86fatah
0
100
執筆テーマの決め方
sapi_kawahara
1
150
Featured
See All Featured
Designing with Data
zakiwarfel
94
4.8k
What's in a price? How to price your products and services
michaelherold
236
11k
It's Worth the Effort
3n
180
27k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
185
15k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
226
16k
Embracing the Ebb and Flow
colly
78
4.1k
Clear Off the Table
cherdarchuk
82
310k
RailsConf 2023
tenderlove
0
510
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
501
140k
Navigating Team Friction
lara
177
13k
GitHub's CSS Performance
jonrohan
1023
450k
Transcript
統計の基礎1 2020/8/17 Ver. 1.0
統計学とは? 多数のデータを扱う方法についての学問分野 • 確率論に由来する • カール・ピアソンによる記述統計の確立を嚆矢とする • ロナルド・フィッシャーによる推計統計を経て発展 • 現代的な機械学習、AIの基礎となっている
確率論と統計の繋がり: 二項分布 コイントスの確率論 • 表と裏(1と0)しかない • ベルヌーイ試行と呼ばれる • ベルヌーイ試行の繰り返し積算: 二項分布にしたがう
二項分布 ベルヌーイ試行を繰り返したときの、表の出る頻度 5回試行 10回試行 100回試行 1000回試行 ほぼ半分出るが、確率的試行なのでばらつきを含む
二項分布の確率質量関数 = ∙ 1 − − P: 表が出る回数がkとなる確率、n: 試行の数、p: 表が出る確率、k:
表が出る回数 二項分布の表が出る回数、確率は以下の式で表わされる • n C k はn回の試行のうち、表が出る組み合わせ • pk(1-p)n-kは表・裏が出る確率の積
二項分布と統計 2値のみで表わされる事象は多い • 感染症の罹患(罹患している/していない) • 試合の勝ち負け • 製品を購入した/しなかった 確率分布を利用したシミュレーション/解析が可能 統計データを確率分布から理解する
データとその分布 確率分布にはたくさんの種類がある 1か0しかないデータ ベルヌーイ試行の繰り返し まれな現象の発生数 まれな現象の発生時間間隔 製品の重さのばらつき 年収の分布 ベルヌーイ分布 二項分布
ポアソン分布 指数分布 正規分布 対数正規分布 分布を仮定することで、データを理解することができる
線形回帰 2つの量の関係を示す式を計算する 最も妥当な線を引くためにはどうするのか?
線形回帰と正規分布 ばらつきは縦に正規分布すると考える 正規分布を仮定すれば、点からの距離の和を最小にすればいい
正規分布とは何か? 母平均と標本平均の誤差の分布のこと • 母集団はあり得るすべての情報を含む • 標本集団は母集団の一部
母集団と標本集団 • 母集団は仮定の集団で、直接観測はできない • 我々が扱うのはすべて標本集団 • 観測できるデータは母集団からの抽出である
正規分布とは何か? 母平均と標本平均の誤差の分布のこと • 標本を抽出し、平均を計算する • 標本の平均と母平均の差を計算する • この試行を無限回繰り返し、差の分布を取る • この差の分布が正規分布にしたがう
(中央極限定理と呼ばれる)
正規分布の確率密度関数 = 1 22 ex p − − 2 22
μは平均、σは標準偏差 • 左右対称・+∞~-∞の範囲を持つ • 標準偏差(σ)範囲に68%のデータが含まれる • 3 σに99.7%のデータが含まれる
正規分布を仮定した線形回帰 最小二乗法は正規分布を仮定した上で成り立つ • 正規分布では上下のばらつきは等価 • 左の赤線の和を最小にすればよい • 二乗和の最小値は計算が用意 直線回帰の基礎は正規分布にある
まとめ • 統計学は確率論の延長上にある • 分布を仮定することで、観測結果を解析できる • 観測データはすべて標本で、母集団は直接観測できない • 正規分布を基に線形回帰が成り立っている