Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
私が知っておきたかった統計手法 / Statistical methods I wanted...
Search
TAKAyukiatkwsk
May 16, 2020
Technology
0
240
私が知っておきたかった統計手法 / Statistical methods I wanted to know
Kanazawa.rb meetup #93 で発表した資料です。
TAKAyukiatkwsk
May 16, 2020
Tweet
Share
More Decks by TAKAyukiatkwsk
See All by TAKAyukiatkwsk
argo-rolloutsにコミットした話
takayukiatkwsk
0
31
EnvoyのWasm filterを体験する
takayukiatkwsk
0
44
自分用趣味アプリを作っている話
takayukiatkwsk
0
96
zoxideのご紹介
takayukiatkwsk
0
90
Kanazawa.rbに参加してからのふりかえり
takayukiatkwsk
0
46
git-secretsとgitフックをざっと理解する
takayukiatkwsk
0
330
計測プラットフォームSREチームとシステム障害対応 / measurement platform SRE team's incident response
takayukiatkwsk
0
1.1k
Flutterに入門して体重グラフアプリを作る / Get started Flutter and build a weight graph app
takayukiatkwsk
0
410
リモートワークを振り返る / Look back on remote-working
takayukiatkwsk
0
120
Other Decks in Technology
See All in Technology
Talk to Someone At Delta Airlines™️ USA Contact Numbers
travelcarecenter
0
160
TLSから見るSREの未来
atpons
2
310
[SRE NEXT 2025] すみずみまで暖かく照らすあなたの太陽でありたい
carnappopper
2
470
ソフトウェアQAがハードウェアの人になったの
mineo_matsuya
3
200
How to Quickly Call American Airlines®️ U.S. Customer Care : Full Guide
flyaahelpguide
0
240
セキュアなAI活用のためのLiteLLMの可能性
tk3fftk
1
330
サイバーエージェントグループのSRE10年の歩みとAI時代の生存戦略
shotatsuge
4
1k
VS CodeとGitHub Copilotで爆速開発!アップデートの波に乗るおさらい会 / Rapid Development with VS Code and GitHub Copilot: Catch the Latest Wave
yamachu
3
460
Snowflake Intelligenceという名のAI Agentが切り開くデータ活用の未来とその実現に必要なこと@SnowVillage『Data Management #1 Summit 2025 Recap!!』
ryo_suzuki
1
160
Microsoft Defender XDRで疲弊しないためのインシデント対応
sophiakunii
1
320
AWS 怖い話 WAF編 @fillz_noh #AWSStartup #AWSStartup_Kansai
fillznoh
0
130
LIXIL基幹システム刷新に立ち向かう技術的アプローチについて
tsukuha
1
380
Featured
See All Featured
Building an army of robots
kneath
306
45k
Six Lessons from altMBA
skipperchong
28
3.9k
How to train your dragon (web standard)
notwaldorf
96
6.1k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Docker and Python
trallard
45
3.5k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Git: the NoSQL Database
bkeepers
PRO
430
65k
Why Our Code Smells
bkeepers
PRO
337
57k
[RailsConf 2023] Rails as a piece of cake
palkan
55
5.7k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
282
13k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Code Review Best Practice
trishagee
69
19k
Transcript
私が知っておきたかった 統計手法 Kanazawa.rb meetup #93 Takayuki Takagi
Who am I? • Takayuki Takagi (高木貴之 / ニボシーニョ) •
@TAKAyuki_atkwsk / takayukiatkwsk • Freelance programmer • Working from home • Scala, Ruby, Python, AWS, Docker, etc. • Like beer and gyoza
今日の話 私が知っておきたかった統計手法を紹介します。 皆さんにとっては当たり前のことが多いかもしれません。 間違っていたら後で教えてください。
なぜ知っておきたかったのか • 数字やグラフを見ても意味が分からない ◦ Webサービスの監視 ◦ 調査レポート ◦ Covid-19 •
判断材料があるのにないことになってしまう ◦ それは困るので読めるようになりたい
分位数(quantile) • 定義 ◦ 「ある種の正の整数 m に対し、分布を m 等分する m-1
個の値、つまり、 i=1,...,m-1 に対する i/m 分位数を、m 分位数(ただし m は漢数字)とい う。」 ◦ https://ja.wikipedia.org/wiki/%E5%88%86%E4%BD%8D%E6%95%B0 • 中央値(第2四分位数、50パーセンタイル)、90パーセンタイ ル、95パーセンタイルはよく見る • ex.) レスポンスタイム
分位数: 降水量の例 金沢市の1月〜3月の降水量(ミリ/日) mean: 6.05 min: 0.00 median: 3.50 75
percentile: 8.75 90 percentile: 15.00 95 percentile: 18.25 max: 39.00 東京の1月〜3月の降水量(ミリ/日) mean: 2.49 min: 0.00 median: 0.00 75 percentile: 0.50 90 percentile: 6.00 95 percentile: 14.25 max: 55.50
移動平均(moving average) • 定義(単純移動平均) ◦ 「直近の n 個のデータの重み付けのない単純な平均である」 ◦ https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%
E5%9D%87 • データを平滑化する効果がある • 時系列データでよく使われる • ex.) Webサーバーへのリクエスト数、株価
移動平均: 最高気温の例 金沢市の最高気温(2020-04-04〜2020-05-04)
片対数グラフ(semi-log graph) • 定義 ◦ 「グラフの一方の軸が対数スケール(縦を対数スケールとすることが多い) になっているグラフである。極端に範囲の広いデータを扱える。」 ◦ https://ja.wikipedia.org/wiki/%E7%89%87%E5%AF%BE%E6%95%B0%E 3%82%B0%E3%83%A9%E3%83%95
• ex.) Covid-19の感染者数グラフ ◦ https://datausa.io/coronavirus
片対数グラフ: Covid-19の例 東京都と石川県のCovid-19累計感染者数(2020-01-24〜2020-05-09)
まとめ • 挙げたものについては、データの傾向が読み取れるように なった • 傾向が分かれば(将来的な)変化や異常値に気付ける ◦ 要因はこれだけでは分からないことを念頭に置く • Survive
していきましょう
参考資料 • 気象データ(CSV形式でダウンロード可) ◦ https://www.data.jma.go.jp/gmd/risk/obsdl/index.php • Covid-19感染者数データ ◦ https://raw.githubusercontent.com/tokyo-metropolitan-gov/covid19/ master/data/data.json
◦ https://raw.githubusercontent.com/prefishikawa/covid19/master/dat a/patients_summary.json