Slide 1

Slide 1 text

第28回 中国地方DB勉強会 in 岡山 #ChugokuDB stddev_popと stddev_sampの話

Slide 2

Slide 2 text

お前誰よ ⾓⽥ 裕樹(Yuuki Sumida) @razon 株式会社アイネット 取締役 技術統括部⻑ 飲み会の予約チョットデキル

Slide 3

Slide 3 text

今日はあまり宣伝することがないので… PS4持ってる⼈は⼗三機兵防衛圏を買おう(体験版あります)

Slide 4

Slide 4 text

本題

Slide 5

Slide 5 text

集計してますか?

Slide 6

Slide 6 text

sum() count() avg() min() max()

Slide 7

Slide 7 text

第28回 中国地方DB勉強会 in 岡山 #ChugokuDB stddev_popと stddev_sampの話

Slide 8

Slide 8 text

平均(Average)

Slide 9

Slide 9 text

分散(Variance)

Slide 10

Slide 10 text

標準偏差(Standard Deviation)

Slide 11

Slide 11 text

おまけ(偏差値)

Slide 12

Slide 12 text

ここまで⺟集団(population)に関する話 データの集合の特徴・特性を表す 中央値(Median), 最頻値(Mode) ... 複数の⺟集団同⼠の⽐較

Slide 13

Slide 13 text

第28回 中国地方DB勉強会 in 岡山 #ChugokuDB stddev_popと stddev_sampの話

Slide 14

Slide 14 text

第28回 中国地方DB勉強会 in 岡山 #ChugokuDB stddev_popと stddev_sampの話

Slide 15

Slide 15 text

標本(sample) ⺟集団の値が集められない, データが ⼤きすぎる… 標本から⺟集団の値を推測する

Slide 16

Slide 16 text

var_samp() stddev_samp()

Slide 17

Slide 17 text

厳密には不偏分散(unbiased variance) 不偏分散の平⽅根≠不偏標準偏差 ※諸説あります

Slide 18

Slide 18 text

※ExcelとかRもそんな感じだからっぽい ※ExcelとかRもそんな感じだからっぽい

Slide 19

Slide 19 text

統計わかるマンに詳しい話を聞きたい