Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計の基礎1
Search
xjorv
January 24, 2021
Education
0
360
統計の基礎1
統計の基礎1では、確率論と統計の関係、データの分布、回帰について説明します。
xjorv
January 24, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.8k
コンパートメントモデルをStanで解く
xjorv
0
470
生物学的同等性試験 検出力の計算法
xjorv
0
3.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.4k
粉体特性2
xjorv
0
2.5k
粉体特性1
xjorv
0
2.9k
皮膜5
xjorv
0
2.4k
皮膜4
xjorv
0
2.3k
皮膜3
xjorv
0
2.3k
Other Decks in Education
See All in Education
JavaScript - Lecture 6 - Web Technologies (1019888BNR)
signer
PRO
0
3.1k
CSS3 and Responsive Web Design - Lecture 5 - Web Technologies (1019888BNR)
signer
PRO
1
3k
【ZEPメタバース校舎操作ガイド】
ainischool
0
600
The knowledge panel is your new homepage
bradwetherall
0
210
Web Search and SEO - Lecture 10 - Web Technologies (1019888BNR)
signer
PRO
2
3k
今の私を形作る4つの要素と偶然の出会い(セレンディピティ)
mamohacy
2
120
✅ レポート採点基準 / How Your Reports Are Assessed
yasslab
PRO
0
140
子どもが自立した学習者となるデジタルの活用について
naokikato
PRO
0
150
Портфолио - Шынар Ауелбекова
shynar
0
140
Introduction - Lecture 1 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
2.7k
DIP_1_Introduction
hachama
0
330
HTML5 and the Open Web Platform - Lecture 3 - Web Technologies (1019888BNR)
signer
PRO
2
3.1k
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
5.9k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Thoughts on Productivity
jonyablonski
73
4.9k
Writing Fast Ruby
sferik
630
62k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
Unsuck your backbone
ammeep
671
58k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
[RailsConf 2023] Rails as a piece of cake
palkan
58
6.1k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.8k
Faster Mobile Websites
deanohume
310
31k
Transcript
統計の基礎1 2020/8/17 Ver. 1.0
統計学とは? 多数のデータを扱う方法についての学問分野 • 確率論に由来する • カール・ピアソンによる記述統計の確立を嚆矢とする • ロナルド・フィッシャーによる推計統計を経て発展 • 現代的な機械学習、AIの基礎となっている
確率論と統計の繋がり: 二項分布 コイントスの確率論 • 表と裏(1と0)しかない • ベルヌーイ試行と呼ばれる • ベルヌーイ試行の繰り返し積算: 二項分布にしたがう
二項分布 ベルヌーイ試行を繰り返したときの、表の出る頻度 5回試行 10回試行 100回試行 1000回試行 ほぼ半分出るが、確率的試行なのでばらつきを含む
二項分布の確率質量関数 = ∙ 1 − − P: 表が出る回数がkとなる確率、n: 試行の数、p: 表が出る確率、k:
表が出る回数 二項分布の表が出る回数、確率は以下の式で表わされる • n C k はn回の試行のうち、表が出る組み合わせ • pk(1-p)n-kは表・裏が出る確率の積
二項分布と統計 2値のみで表わされる事象は多い • 感染症の罹患(罹患している/していない) • 試合の勝ち負け • 製品を購入した/しなかった 確率分布を利用したシミュレーション/解析が可能 統計データを確率分布から理解する
データとその分布 確率分布にはたくさんの種類がある 1か0しかないデータ ベルヌーイ試行の繰り返し まれな現象の発生数 まれな現象の発生時間間隔 製品の重さのばらつき 年収の分布 ベルヌーイ分布 二項分布
ポアソン分布 指数分布 正規分布 対数正規分布 分布を仮定することで、データを理解することができる
線形回帰 2つの量の関係を示す式を計算する 最も妥当な線を引くためにはどうするのか?
線形回帰と正規分布 ばらつきは縦に正規分布すると考える 正規分布を仮定すれば、点からの距離の和を最小にすればいい
正規分布とは何か? 母平均と標本平均の誤差の分布のこと • 母集団はあり得るすべての情報を含む • 標本集団は母集団の一部
母集団と標本集団 • 母集団は仮定の集団で、直接観測はできない • 我々が扱うのはすべて標本集団 • 観測できるデータは母集団からの抽出である
正規分布とは何か? 母平均と標本平均の誤差の分布のこと • 標本を抽出し、平均を計算する • 標本の平均と母平均の差を計算する • この試行を無限回繰り返し、差の分布を取る • この差の分布が正規分布にしたがう
(中央極限定理と呼ばれる)
正規分布の確率密度関数 = 1 22 ex p − − 2 22
μは平均、σは標準偏差 • 左右対称・+∞~-∞の範囲を持つ • 標準偏差(σ)範囲に68%のデータが含まれる • 3 σに99.7%のデータが含まれる
正規分布を仮定した線形回帰 最小二乗法は正規分布を仮定した上で成り立つ • 正規分布では上下のばらつきは等価 • 左の赤線の和を最小にすればよい • 二乗和の最小値は計算が用意 直線回帰の基礎は正規分布にある
まとめ • 統計学は確率論の延長上にある • 分布を仮定することで、観測結果を解析できる • 観測データはすべて標本で、母集団は直接観測できない • 正規分布を基に線形回帰が成り立っている