Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
私が知っておきたかった統計手法 / Statistical methods I wanted...
Search
TAKAyukiatkwsk
May 16, 2020
Technology
0
240
私が知っておきたかった統計手法 / Statistical methods I wanted to know
Kanazawa.rb meetup #93 で発表した資料です。
TAKAyukiatkwsk
May 16, 2020
Tweet
Share
More Decks by TAKAyukiatkwsk
See All by TAKAyukiatkwsk
Claude Codeと共に構成図を作る
takayukiatkwsk
0
31
argo-rolloutsにコミットした話
takayukiatkwsk
0
43
EnvoyのWasm filterを体験する
takayukiatkwsk
0
48
自分用趣味アプリを作っている話
takayukiatkwsk
0
110
zoxideのご紹介
takayukiatkwsk
0
98
Kanazawa.rbに参加してからのふりかえり
takayukiatkwsk
0
50
git-secretsとgitフックをざっと理解する
takayukiatkwsk
0
340
計測プラットフォームSREチームとシステム障害対応 / measurement platform SRE team's incident response
takayukiatkwsk
0
1.1k
Flutterに入門して体重グラフアプリを作る / Get started Flutter and build a weight graph app
takayukiatkwsk
0
420
Other Decks in Technology
See All in Technology
LLMを搭載したプロダクトの品質保証の模索と学び
qa
0
1k
AIエージェント開発用SDKとローカルLLMをLINE Botと組み合わせてみた / LINEを使ったLT大会 #14
you
PRO
0
110
今!ソフトウェアエンジニアがハードウェアに手を出すには
mackee
12
4.7k
「Linux」という言葉が指すもの
sat
PRO
4
130
CDK CLIで使ってたあの機能、CDK Toolkit Libraryではどうやるの?
smt7174
4
160
S3アクセス制御の設計ポイント
tommy0124
3
200
5分でカオスエンジニアリングを分かった気になろう
pandayumi
0
240
Webアプリケーションにオブザーバビリティを実装するRust入門ガイド
nwiizo
7
800
なぜテストマネージャの視点が 必要なのか? 〜 一歩先へ進むために 〜
moritamasami
0
220
allow_retry と Arel.sql / allow_retry and Arel.sql
euglena1215
1
160
「全員プロダクトマネージャー」を実現する、Cursorによる仕様検討の自動運転
applism118
21
10k
Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」
shisyu_gaku
0
160
Featured
See All Featured
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Fireside Chat
paigeccino
39
3.6k
The Cost Of JavaScript in 2023
addyosmani
53
8.9k
Embracing the Ebb and Flow
colly
87
4.8k
Six Lessons from altMBA
skipperchong
28
4k
Docker and Python
trallard
45
3.6k
Unsuck your backbone
ammeep
671
58k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.2k
Statistics for Hackers
jakevdp
799
220k
Producing Creativity
orderedlist
PRO
347
40k
Mobile First: as difficult as doing things right
swwweet
224
9.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Transcript
私が知っておきたかった 統計手法 Kanazawa.rb meetup #93 Takayuki Takagi
Who am I? • Takayuki Takagi (高木貴之 / ニボシーニョ) •
@TAKAyuki_atkwsk / takayukiatkwsk • Freelance programmer • Working from home • Scala, Ruby, Python, AWS, Docker, etc. • Like beer and gyoza
今日の話 私が知っておきたかった統計手法を紹介します。 皆さんにとっては当たり前のことが多いかもしれません。 間違っていたら後で教えてください。
なぜ知っておきたかったのか • 数字やグラフを見ても意味が分からない ◦ Webサービスの監視 ◦ 調査レポート ◦ Covid-19 •
判断材料があるのにないことになってしまう ◦ それは困るので読めるようになりたい
分位数(quantile) • 定義 ◦ 「ある種の正の整数 m に対し、分布を m 等分する m-1
個の値、つまり、 i=1,...,m-1 に対する i/m 分位数を、m 分位数(ただし m は漢数字)とい う。」 ◦ https://ja.wikipedia.org/wiki/%E5%88%86%E4%BD%8D%E6%95%B0 • 中央値(第2四分位数、50パーセンタイル)、90パーセンタイ ル、95パーセンタイルはよく見る • ex.) レスポンスタイム
分位数: 降水量の例 金沢市の1月〜3月の降水量(ミリ/日) mean: 6.05 min: 0.00 median: 3.50 75
percentile: 8.75 90 percentile: 15.00 95 percentile: 18.25 max: 39.00 東京の1月〜3月の降水量(ミリ/日) mean: 2.49 min: 0.00 median: 0.00 75 percentile: 0.50 90 percentile: 6.00 95 percentile: 14.25 max: 55.50
移動平均(moving average) • 定義(単純移動平均) ◦ 「直近の n 個のデータの重み付けのない単純な平均である」 ◦ https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%
E5%9D%87 • データを平滑化する効果がある • 時系列データでよく使われる • ex.) Webサーバーへのリクエスト数、株価
移動平均: 最高気温の例 金沢市の最高気温(2020-04-04〜2020-05-04)
片対数グラフ(semi-log graph) • 定義 ◦ 「グラフの一方の軸が対数スケール(縦を対数スケールとすることが多い) になっているグラフである。極端に範囲の広いデータを扱える。」 ◦ https://ja.wikipedia.org/wiki/%E7%89%87%E5%AF%BE%E6%95%B0%E 3%82%B0%E3%83%A9%E3%83%95
• ex.) Covid-19の感染者数グラフ ◦ https://datausa.io/coronavirus
片対数グラフ: Covid-19の例 東京都と石川県のCovid-19累計感染者数(2020-01-24〜2020-05-09)
まとめ • 挙げたものについては、データの傾向が読み取れるように なった • 傾向が分かれば(将来的な)変化や異常値に気付ける ◦ 要因はこれだけでは分からないことを念頭に置く • Survive
していきましょう
参考資料 • 気象データ(CSV形式でダウンロード可) ◦ https://www.data.jma.go.jp/gmd/risk/obsdl/index.php • Covid-19感染者数データ ◦ https://raw.githubusercontent.com/tokyo-metropolitan-gov/covid19/ master/data/data.json
◦ https://raw.githubusercontent.com/prefishikawa/covid19/master/dat a/patients_summary.json