Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
私が知っておきたかった統計手法 / Statistical methods I wanted...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
TAKAyukiatkwsk
May 16, 2020
Technology
0
250
私が知っておきたかった統計手法 / Statistical methods I wanted to know
Kanazawa.rb meetup #93 で発表した資料です。
TAKAyukiatkwsk
May 16, 2020
Tweet
Share
More Decks by TAKAyukiatkwsk
See All by TAKAyukiatkwsk
「技術職として歩んできた私がチーム運営を考える上で出会った2冊の本」の補足ともう1冊
takayukiatkwsk
0
36
Claude Codeと共に構成図を作る
takayukiatkwsk
0
150
argo-rolloutsにコミットした話
takayukiatkwsk
0
72
EnvoyのWasm filterを体験する
takayukiatkwsk
0
61
自分用趣味アプリを作っている話
takayukiatkwsk
0
140
zoxideのご紹介
takayukiatkwsk
0
120
Kanazawa.rbに参加してからのふりかえり
takayukiatkwsk
0
63
git-secretsとgitフックをざっと理解する
takayukiatkwsk
0
380
計測プラットフォームSREチームとシステム障害対応 / measurement platform SRE team's incident response
takayukiatkwsk
0
1.2k
Other Decks in Technology
See All in Technology
今日から始めるAmazon Bedrock AgentCore
har1101
4
420
Amazon S3 Vectorsを使って資格勉強用AIエージェントを構築してみた
usanchuu
3
450
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
4
220
Webhook best practices for rock solid and resilient deployments
glaforge
2
300
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
2
380
【Ubie】AIを活用した広告アセット「爆速」生成事例 | AI_Ops_Community_Vol.2
yoshiki_0316
1
110
私たち準委任PdEは2つのプロダクトに挑戦する ~ソフトウェア、開発支援という”二重”のプロダクトエンジニアリングの実践~ / 20260212 Naoki Takahashi
shift_evolve
PRO
1
100
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
4
1.4k
What happened to RubyGems and what can we learn?
mikemcquaid
0
310
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
13k
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
2k
OpenShiftでllm-dを動かそう!
jpishikawa
0
130
Featured
See All Featured
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
Facilitating Awesome Meetings
lara
57
6.8k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
330
[SF Ruby Conf 2025] Rails X
palkan
1
760
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
220
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
117
110k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
0
3.4k
The Curious Case for Waylosing
cassininazir
0
240
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
270
Transcript
私が知っておきたかった 統計手法 Kanazawa.rb meetup #93 Takayuki Takagi
Who am I? • Takayuki Takagi (高木貴之 / ニボシーニョ) •
@TAKAyuki_atkwsk / takayukiatkwsk • Freelance programmer • Working from home • Scala, Ruby, Python, AWS, Docker, etc. • Like beer and gyoza
今日の話 私が知っておきたかった統計手法を紹介します。 皆さんにとっては当たり前のことが多いかもしれません。 間違っていたら後で教えてください。
なぜ知っておきたかったのか • 数字やグラフを見ても意味が分からない ◦ Webサービスの監視 ◦ 調査レポート ◦ Covid-19 •
判断材料があるのにないことになってしまう ◦ それは困るので読めるようになりたい
分位数(quantile) • 定義 ◦ 「ある種の正の整数 m に対し、分布を m 等分する m-1
個の値、つまり、 i=1,...,m-1 に対する i/m 分位数を、m 分位数(ただし m は漢数字)とい う。」 ◦ https://ja.wikipedia.org/wiki/%E5%88%86%E4%BD%8D%E6%95%B0 • 中央値(第2四分位数、50パーセンタイル)、90パーセンタイ ル、95パーセンタイルはよく見る • ex.) レスポンスタイム
分位数: 降水量の例 金沢市の1月〜3月の降水量(ミリ/日) mean: 6.05 min: 0.00 median: 3.50 75
percentile: 8.75 90 percentile: 15.00 95 percentile: 18.25 max: 39.00 東京の1月〜3月の降水量(ミリ/日) mean: 2.49 min: 0.00 median: 0.00 75 percentile: 0.50 90 percentile: 6.00 95 percentile: 14.25 max: 55.50
移動平均(moving average) • 定義(単純移動平均) ◦ 「直近の n 個のデータの重み付けのない単純な平均である」 ◦ https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%
E5%9D%87 • データを平滑化する効果がある • 時系列データでよく使われる • ex.) Webサーバーへのリクエスト数、株価
移動平均: 最高気温の例 金沢市の最高気温(2020-04-04〜2020-05-04)
片対数グラフ(semi-log graph) • 定義 ◦ 「グラフの一方の軸が対数スケール(縦を対数スケールとすることが多い) になっているグラフである。極端に範囲の広いデータを扱える。」 ◦ https://ja.wikipedia.org/wiki/%E7%89%87%E5%AF%BE%E6%95%B0%E 3%82%B0%E3%83%A9%E3%83%95
• ex.) Covid-19の感染者数グラフ ◦ https://datausa.io/coronavirus
片対数グラフ: Covid-19の例 東京都と石川県のCovid-19累計感染者数(2020-01-24〜2020-05-09)
まとめ • 挙げたものについては、データの傾向が読み取れるように なった • 傾向が分かれば(将来的な)変化や異常値に気付ける ◦ 要因はこれだけでは分からないことを念頭に置く • Survive
していきましょう
参考資料 • 気象データ(CSV形式でダウンロード可) ◦ https://www.data.jma.go.jp/gmd/risk/obsdl/index.php • Covid-19感染者数データ ◦ https://raw.githubusercontent.com/tokyo-metropolitan-gov/covid19/ master/data/data.json
◦ https://raw.githubusercontent.com/prefishikawa/covid19/master/dat a/patients_summary.json