Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
私が知っておきたかった統計手法 / Statistical methods I wanted to know
TAKAyukiatkwsk
May 16, 2020
Technology
0
98
私が知っておきたかった統計手法 / Statistical methods I wanted to know
Kanazawa.rb meetup #93 で発表した資料です。
TAKAyukiatkwsk
May 16, 2020
Tweet
Share
More Decks by TAKAyukiatkwsk
See All by TAKAyukiatkwsk
Kanazawa.rbに参加してからのふりかえり
takayukiatkwsk
0
6
git-secretsとgitフックをざっと理解する
takayukiatkwsk
0
36
計測プラットフォームSREチームとシステム障害対応 / measurement platform SRE team's incident response
takayukiatkwsk
0
520
Flutterに入門して体重グラフアプリを作る / Get started Flutter and build a weight graph app
takayukiatkwsk
0
200
リモートワークを振り返る / Look back on remote-working
takayukiatkwsk
0
47
ブログでのアウトプットが減っている件 / What long intervals my blog posts have!
takayukiatkwsk
0
49
謎のDOMアクセス / Mysterious DOM access
takayukiatkwsk
0
46
AWS認定を取得したよ #kzrb
takayukiatkwsk
0
1.2k
カンファレンスセッションの選択傾向を知りたい / Let’s study trends of entry to conference sessions
takayukiatkwsk
0
100
Other Decks in Technology
See All in Technology
UNIX は知らない。でも AWS は知ってる。 そんな僕が『 UNIX という考え方』を 読んでみた件
kentosuzuki
1
270
データベースの発表には RDBMS 以外もありますよ
maroon1st
0
210
Visual Studio Codeのタスク機能の使い方
ismt7
0
170
GitHub Codespaces が拡げる開発環境、いつでもどこでも Visual Studio Code で!
dzeyelid
0
150
なぜ変化を起こすのが難しいのか? - 数年以上にわたって難しさに向き合い・考え取り組んできたこと / The reason why changing organization is so hard - What I thought and faced for more than several years
iwashi86
26
17k
「私考える人、あなた作業する人」を越えて、プロダクトマネジメントがあたりまえになるチームを明日から実現していく方法/product management rsgt2023
moriyuya
60
37k
聴覚障害のある大学生チームによる臆さない発言環境の形成
hayato_ukuk
0
1.7k
ステート管理を超えるRecoil運用の考え方
uhyo
7
5k
AKIBA.SaaS資料
yasumuusan
0
150
OCIコンテナサービス関連の技術詳細 /oke-ocir-details
oracle4engineer
PRO
0
730
2023年は何する宣言
shigeruoda
0
230
AI Services 概要 / AI Services overview
oracle4engineer
PRO
0
160
Featured
See All Featured
Building an army of robots
kneath
302
40k
The Brand Is Dead. Long Live the Brand.
mthomps
48
2.9k
Build your cross-platform service in a week with App Engine
jlugia
221
17k
Art, The Web, and Tiny UX
lynnandtonic
284
18k
What's new in Ruby 2.0
geeforr
336
30k
Product Roadmaps are Hard
iamctodd
38
7.7k
Infographics Made Easy
chrislema
235
17k
Ruby is Unlike a Banana
tanoku
93
9.5k
Intergalactic Javascript Robots from Outer Space
tanoku
261
26k
Web Components: a chance to create the future
zenorocha
304
40k
Principles of Awesome APIs and How to Build Them.
keavy
117
15k
Reflections from 52 weeks, 52 projects
jeffersonlam
338
18k
Transcript
私が知っておきたかった 統計手法 Kanazawa.rb meetup #93 Takayuki Takagi
Who am I? • Takayuki Takagi (高木貴之 / ニボシーニョ) •
@TAKAyuki_atkwsk / takayukiatkwsk • Freelance programmer • Working from home • Scala, Ruby, Python, AWS, Docker, etc. • Like beer and gyoza
今日の話 私が知っておきたかった統計手法を紹介します。 皆さんにとっては当たり前のことが多いかもしれません。 間違っていたら後で教えてください。
なぜ知っておきたかったのか • 数字やグラフを見ても意味が分からない ◦ Webサービスの監視 ◦ 調査レポート ◦ Covid-19 •
判断材料があるのにないことになってしまう ◦ それは困るので読めるようになりたい
分位数(quantile) • 定義 ◦ 「ある種の正の整数 m に対し、分布を m 等分する m-1
個の値、つまり、 i=1,...,m-1 に対する i/m 分位数を、m 分位数(ただし m は漢数字)とい う。」 ◦ https://ja.wikipedia.org/wiki/%E5%88%86%E4%BD%8D%E6%95%B0 • 中央値(第2四分位数、50パーセンタイル)、90パーセンタイ ル、95パーセンタイルはよく見る • ex.) レスポンスタイム
分位数: 降水量の例 金沢市の1月〜3月の降水量(ミリ/日) mean: 6.05 min: 0.00 median: 3.50 75
percentile: 8.75 90 percentile: 15.00 95 percentile: 18.25 max: 39.00 東京の1月〜3月の降水量(ミリ/日) mean: 2.49 min: 0.00 median: 0.00 75 percentile: 0.50 90 percentile: 6.00 95 percentile: 14.25 max: 55.50
移動平均(moving average) • 定義(単純移動平均) ◦ 「直近の n 個のデータの重み付けのない単純な平均である」 ◦ https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%
E5%9D%87 • データを平滑化する効果がある • 時系列データでよく使われる • ex.) Webサーバーへのリクエスト数、株価
移動平均: 最高気温の例 金沢市の最高気温(2020-04-04〜2020-05-04)
片対数グラフ(semi-log graph) • 定義 ◦ 「グラフの一方の軸が対数スケール(縦を対数スケールとすることが多い) になっているグラフである。極端に範囲の広いデータを扱える。」 ◦ https://ja.wikipedia.org/wiki/%E7%89%87%E5%AF%BE%E6%95%B0%E 3%82%B0%E3%83%A9%E3%83%95
• ex.) Covid-19の感染者数グラフ ◦ https://datausa.io/coronavirus
片対数グラフ: Covid-19の例 東京都と石川県のCovid-19累計感染者数(2020-01-24〜2020-05-09)
まとめ • 挙げたものについては、データの傾向が読み取れるように なった • 傾向が分かれば(将来的な)変化や異常値に気付ける ◦ 要因はこれだけでは分からないことを念頭に置く • Survive
していきましょう
参考資料 • 気象データ(CSV形式でダウンロード可) ◦ https://www.data.jma.go.jp/gmd/risk/obsdl/index.php • Covid-19感染者数データ ◦ https://raw.githubusercontent.com/tokyo-metropolitan-gov/covid19/ master/data/data.json
◦ https://raw.githubusercontent.com/prefishikawa/covid19/master/dat a/patients_summary.json