Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webサービス開発に必要な統計学入門 / study of statistics for web developers
Search
yudppp
July 26, 2019
Education
1
230
Webサービス開発に必要な統計学入門 / study of statistics for web developers
社内勉強会にて簡単に統計学について話しました。
統計学を身近に感じてもらいたかった資料です。
yudppp
July 26, 2019
Tweet
Share
More Decks by yudppp
See All by yudppp
未知のプログラミング言語にChatGPTと共に挑む
yudppp
0
240
SaaSフロントエンド開発の現場で求められる技術 / Technologies for SaaS Frontend Development in the Field
yudppp
2
67
2019年 HRBrainの技術的挑戦 / hrbain technology challenge 2019
yudppp
3
1.2k
Web開発を支えるマイグレーションツールについて / sqldef introduction for psql users
yudppp
2
2.9k
ISUCON向けのツールを作った話 / isutools
yudppp
1
210
Row Level Securityはマルチテナントの銀の弾丸になりうるのか / Row Level Security is silver bullet for multitenancy?
yudppp
19
22k
メジャーな Live Reloaderの違いをちゃんと調べて見た / Compare major live reloader of Go
yudppp
1
1.7k
今年お世話になったnpm module
yudppp
1
820
Goで社内向け管理画面を楽に作る方法
yudppp
5
9.9k
Other Decks in Education
See All in Education
Слайды блока№1 к мини-курсу "Разговорные фразы" по "Минифразу Гуннемарка" арабского языка
jameela
0
190
2024年度春学期 統計学 第2回 統計資料の収集と読み方 (2024. 4. 18)
akiraasano
PRO
0
110
2024年度 サイバーエージェント新卒社内研修の「データモデリング」の資料公開
chiba_katsu
2
3.4k
アイスブレイク:自己紹介ポーカーワークショップ(KAG版)
junki
2
270
Matz に頼られたので張り切って2時間ほどドイツと日本の互いの Ruby 学習事情についてディスカッションした話
yasulab
1
320
CULTURA I VALORS
cumclavis
PRO
1
170
AGU情報社会論 2024 #03 "CC BY-SA"
fullfull
0
140
【ServiceNow SNUG Meetup LT deck】Washington D.C. 新機能 Time-Limited Rolesを触ってみた
senon
0
160
Ch8_-_Partie_2.pdf
bernhardsvt
0
120
ブームだけで終わらせない、組織内でコーチングを活用する方法/How to Use Coaching in Your Organization Without It Being Just a Fad
yuko_yokouchi
1
190
「最初の本」の紹介
eltociear
1
210
Gemini in Android Studio 使ってますか?
satoryo56
0
130
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
36
9.1k
Designing for Performance
lara
604
67k
10 Git Anti Patterns You Should be Aware of
lemiorhan
652
58k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
189
16k
Rails Girls Zürich Keynote
gr2m
93
13k
Designing the Hi-DPI Web
ddemaree
276
34k
Fantastic passwords and where to find them - at NoRuKo
philnash
42
2.7k
The Invisible Customer
myddelton
117
13k
Creatively Recalculating Your Daily Design Routine
revolveconf
214
11k
A Modern Web Designer's Workflow
chriscoyier
689
190k
How to train your dragon (web standard)
notwaldorf
79
5.5k
Build your cross-platform service in a week with App Engine
jlugia
227
17k
Transcript
Webサービス開発に 必要な統計学⼊⾨ HRBrain社内勉強会(15min)
⾃⼰紹介 • @yudppp • 株式会社HRBrain CTO • 好きな⾔葉: 冪等性 •
Go / React / TypeScript • ◦△□ - https://blog.yudppp.com/
アジェンダ • なぜ統計学が必要か • 尺度 • 正規分布 • データの代表値 •
ペーパーテスト • 丸つけ / 解説
なぜ統計学が必要か • 選挙の当確を早く出せる • ⽐例代表が当確が遅いのはなぜか(政治学科 卒の⽅に聞く) • 開票率1%で当選確実を出している • 1%て少なくないか
スープの味⾒をするときに どのくらい飲みますか?
私は しっかり混ぜてから ⼀⼝分飲みます
統計学的にも しっかり混ぜてから 飲むのが⼤事 (無作為抽出?)
前置きは以上で本題
尺度
None
最近仕事中にたくさん使って ます。
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ࣭తσʔλ ྔతσʔλ
尺度(scale) • 尺度には4つの種類があります。 • 名義尺度 • 順序尺度 • 間隔尺度 •
⽐例尺度 ঃʑʹৄࡉ͕૿͍͖ͯ͠·͢
名義尺度(nominal scale) • 単に他と区別された分類 • 例 • 職種(Sales/CustomerSuccess/Engineer) • ⾎液型(A型/B型/O型AB型)
順序尺度(ordinal scale) • 順序をもつ尺度 • 例 • 職種(Assistant Producer/Producer/Executive Producer)
• 評価(S評価/A評価/B評価/C評価/D評価) • グレード(P1/P2/P3/P4/P5) • 順位(1位/2位/3位)
間隔尺度(interval scale) • ⽬盛りが等間隔になっている尺度 • 例 • 評価(10点満点) • PageSpeed
Insightsのスコア • 摂⽒温度 • ⻄暦
⽐例尺度(ratio scale) • ゼロを基点に間隔や⽐率にも意味がある尺度 • 例 • ⾝⻑ • 年齢
• レスポンス時間
よくある間違い • 間隔尺度と⽐例尺度を間違う • ◯倍するみたいなことができたら⽐例尺度 • 20℃は10℃の2倍暑いと⾔えるか • 順序尺度と間隔尺度を間違う •
間隔が等しいかを考える
なぜ尺度が有⽤か • 尺度の種類によってどんなグラフにすべきか が決まる。 • 尺度によって使える代表値が変わる。(代表値 については後で)
正規分布
突然なのですが 私は中学⽣の時に 英語の偏差値が50でした。
偏差値が50の時は 100⼈中 上から何番⽬でしょうか?
50番⽬か51番⽬です。
そして 国語の偏差値が40でした。
偏差値が40の時は 100⼈中 下から何番⽬でしょうか?
15番⽬か16番⽬です。
偏差値 20 30 40 50 60 70 80
偏差値は 平均値が50 標準偏差が10 の正規分布
正規分布(normal distribution)
使われ⽅ • 検定していくのに必要 • JMeterのタイマーとかに正規分布使われてい る • https://jmeter.apache.org/usermanual/ component_reference.html#timers
データの代表値
データを代表する値 というのがあります
例えば 最⼩値・最⼤値・平均値?
平均値(mean) • データの総和をデータ件数で割った値 • [1, 1, 2, 3, 5] =>
(1 + 1 + 2 + 3 + 5) / 5 = 2.4
中央値(median) • データを昇順(降順)に並べた時に中央にくる値 • 奇数の時 • [1, 1, 2, 3,
5] => 2 • 偶数の時 • [1, 1, 2, 3, 5, 8] => (2 + 3) / 2
最頻値(mode) • 最も頻繁に出現した値 • [1, 1, 2, 3, 5] =>
1 • 複数の時もある。 • [1, 1, 2, 2, 5] => 1, 2
正規分布は 平均値=中央値=最頻値 となる
代表値と尺度の関係 • 質的データ(名義尺度,順序尺度)は最頻値しか 取れない • 量的データ(間隔尺度,⽐例尺度)は最頻値、平 均値、中央値が取れる
まとめ • 今回話した話は統計学の⼊⾨者向けの参考書 の⼀章と⼆章にあたるような内容です。 • この先の検定⼿法については個⼈的に調べる か聞いてください。
参考資料 • https://science.sciencemag.org/content/103/2684/677