Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
確率分布の紹介
Search
funain
November 06, 2020
Education
0
640
確率分布の紹介
確率分布に慣れ親しめるように, コイン投げのベルヌーイ分布からスタートして色々な確率分布との関連性を解説しています.
funain
November 06, 2020
Tweet
Share
More Decks by funain
See All by funain
第3回 クイズ大会 問題
funain
0
33
第3回 クイズ大会 解答
funain
0
28
第2回 クイズ大会 問題
funain
0
71
第2回 クイズ大会 解答
funain
0
68
2023年度にやりたいこと(めぐろLT会 #2)
funain
0
430
スクリーニング評価の注意点
funain
0
600
第1回 クイズ大会 問題
funain
0
220
第1回 クイズ大会 解答
funain
0
170
フェアな比較を崩すもの ~交絡と効果修飾~ / Confounding EffectModification
funain
1
420
Other Decks in Education
See All in Education
ロータリー地域社会共同隊(RCC)について:国際ロータリー 2720地区 2023-2024年度 社会奉仕部門 部門長・ 熊本西稜ロータリークラブ・ 有限会社 誠商店 代表取締役社長 追立 武 氏
2720japanoke
0
580
White Snake: Qing's Mission
movingcastal
0
220
「最初の本」の紹介
eltociear
1
210
SelectAIでSQL研修の演習問題に挑む [Oracle]
nisshii
1
130
Ch8_-_Partie_1.pdf
bernhardsvt
0
130
Human-AI Interaction - Lecture 11 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
110
CULTURA I VALORS
cumclavis
PRO
1
170
ポケモンで音象徴
jamashita
0
260
【基本】Oracle Database データベース・ユーザー・セキュリティ入門
oracle4engineer
PRO
1
300
プロダクト・エンジニア・QAE 3軸でのナレッジシェアのススメ
hinac0
1
520
week10@tcue2024
nonxxxizm
0
370
H5P-työkalut
matleenalaakso
3
34k
Featured
See All Featured
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
502
140k
Designing on Purpose - Digital PM Summit 2013
jponch
113
6.6k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
29
2.5k
10 Git Anti Patterns You Should be Aware of
lemiorhan
652
58k
How To Stay Up To Date on Web Technology
chriscoyier
784
250k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
245
1.2M
Code Reviewing Like a Champion
maltzj
517
39k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
189
16k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.3k
The Invisible Side of Design
smashingmag
294
50k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
24
1.8k
Become a Pro
speakerdeck
PRO
15
4.8k
Transcript
確率分布の紹介 2020/11/06
統計学の基本的な考え方 • データは真の分布から生成されているとする(大前提) • データや知識から真の分布を推測していく • 真の分布は, きっとこのような分布であろうと人間が想定して作成し, 推論に使うのが, 統計モデル(確率モデル)
• モデルの組み方のセッティングの違いが頻度論とベイズで異なる • どちらにしても, 統計モデルは確率論の言葉で表現される ⇒ 確率分布に親しむことが統計学の理解の第一歩 ⇒ コイン投げから, 色々な確率分布との関連性を確認していく
図解 : 統計学の基本的な考え方 統計モデル 頻度論, ベイズ 推論 解釈, 予測 真の分布
データ生成 評価 AIC, BIC, WAIC, WBIC, MSE
ベルヌーイ分布 : () ◼モデリングの対象事例 • コイン投げで表が出るか裏が出るか • ある患者が, 死亡・発症などイベントを起こすか否か ◼確率関数
= = ∗ 1 − 1− = 0,1
二項分布 : (, ) ◼モデリングの対象事例 • 枚のコインを投げて, 表が出た枚数は何枚か • 人の患者のうち,
死亡などイベントを起こしたのは何人か ◼確率関数 = = ∗ ∗ 1 − − = 0,1,2, … ,
ベータ分布 : (, ) ◼モデリングの対象事例 • ベルヌーイ分布や二項分布のpのモデリング • 一様乱数(0,1)を +
個生成して, 小さい順に並べたときの前から 番目, 後ろから + 1番目の数が従う分布 ◼確率密度関数 = 1 (, ) −1 ∗ 1 − −1 0 < < 1 ◼ちなみに • 二項分布とベータ分布の関係は多項分布とディリクレ分布の関係と同様
ポアソン分布 : () ◼モデリングの対象事例 • プロイセン陸軍で馬に蹴られて死亡した兵士数 • 一日に緊急入院した患者の人数 ◼確率関数 =
= − ! = 0,1,2, … ◼ちなみに • を増やして、確率を各試行に対してでなくて、微小な時間に対し て与えるイメージ(⇒ ハザード) • 総頻度で条件付けした、独立なポアソン分布の同時分布は多項分布
◼モデリングの対象事例 • 平均1/分に一本やってくる列車が到着するまでの時間 • 病院の受付の待ち時間 ◼確率密度関数 = ∗ − 0
< < ∞ ◼ちなみに • 指数分布とポアソン分布は表と裏の関係 • ある期間に平均回起こるイベントに対して, 何回発生したかが ポアソン分布, 起こるまでにどのくらいかかったが指数分布 指数分布 : ()
ガンマ分布 : (, ) ◼モデリングの対象事例 • 平均1/分に一本やってくる列車が本到着するまでの時間 • 保険金の支払額 ◼確率密度関数
= Γ() ∗ −1− 0 < < ∞ ◼ちなみに • 独立な指数分布に従う確率変数の和の分布はガンマ分布 • この関係は幾何分布と負の二項分布の関係と同様 • カイ二乗分布はガンマ分布の一種
◼モデリングの対象事例 • 部品や人の寿命や故障までの時間 • がん薬物療法の全生存期間(OS)や無増悪生存期間(PFS) ◼確率密度関数 = ∗ ∗ −1
∗ − 0 < < ∞ ◼ちなみに • 指数分布はハザードが一定(どの時間でもイベントが起きる確率 は不変であったが, ワイブル分布はハザードが時間によって変化 • = 1とすれば指数分布になる ワイブル分布 : (, )
関係性のまとめ ベルヌーイ分布 多項分布 ディリクレ分布 ベータ分布 一様分布 ポアソン分布 指数分布 ガンマ分布 ワイブル分布
カイ二乗分布 正規分布 二項分布 複数化 複数化 複数化 ハザード拡張 特殊化 回数と時間 極限 極限 確率の分布 確率の分布 順序の分布 マハラノビクス距離 条件付き同時分布
おまけ • ガウス積分 : −∞ ∞ − − 2
= • ガンマ関数 : Γ = 0 ∞ −1− • ベータ関数 : , = 0 1 −1 1 − −1 = Γ Γ() Γ(+) • スターリングの公式 : ! ≈ 2 • 上の四つの数式が読めると数理統計の見通しがよくなる • 確率分布を特徴づけるパラメータを母数とも呼ぶが, サンプルの数を母数と呼ぶのは誤 用(おそらく, 分母という言葉に引き摺られている)なので, 使わないようにしましょう • サンプルサイズとサンプル数という言葉もややこしいので, 気を付けましょう
参考になるオンライン資料 • 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」 https://www.slideshare.net/matsukenbook/rev012 • 色々な確率分布とその応用 https://www.slideshare.net/hirokiiida165/ss-78477986
• 渡辺澄夫先生のデータ解析の講義資料 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/da2019.html
おしまい