Upgrade to Pro — share decks privately, control downloads, hide ads and more …

私が知っておきたかった統計手法 / Statistical methods I wanted to know

私が知っておきたかった統計手法 / Statistical methods I wanted to know

Kanazawa.rb meetup #93 で発表した資料です。

TAKAyukiatkwsk

May 16, 2020
Tweet

More Decks by TAKAyukiatkwsk

Other Decks in Technology

Transcript

  1. Who am I? • Takayuki Takagi (高木貴之 / ニボシーニョ) •

    @TAKAyuki_atkwsk / takayukiatkwsk • Freelance programmer • Working from home • Scala, Ruby, Python, AWS, Docker, etc. • Like beer and gyoza
  2. なぜ知っておきたかったのか • 数字やグラフを見ても意味が分からない ◦ Webサービスの監視 ◦ 調査レポート ◦ Covid-19 •

    判断材料があるのにないことになってしまう ◦ それは困るので読めるようになりたい
  3. 分位数(quantile) • 定義 ◦ 「ある種の正の整数 m に対し、分布を m 等分する m-1

    個の値、つまり、 i=1,...,m-1 に対する i/m 分位数を、m 分位数(ただし m は漢数字)とい う。」 ◦ https://ja.wikipedia.org/wiki/%E5%88%86%E4%BD%8D%E6%95%B0 • 中央値(第2四分位数、50パーセンタイル)、90パーセンタイ ル、95パーセンタイルはよく見る • ex.) レスポンスタイム
  4. 分位数: 降水量の例 金沢市の1月〜3月の降水量(ミリ/日) mean: 6.05 min: 0.00 median: 3.50 75

    percentile: 8.75 90 percentile: 15.00 95 percentile: 18.25 max: 39.00 東京の1月〜3月の降水量(ミリ/日) mean: 2.49 min: 0.00 median: 0.00 75 percentile: 0.50 90 percentile: 6.00 95 percentile: 14.25 max: 55.50
  5. 移動平均(moving average) • 定義(単純移動平均) ◦ 「直近の n 個のデータの重み付けのない単純な平均である」 ◦ https://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%

    E5%9D%87 • データを平滑化する効果がある • 時系列データでよく使われる • ex.) Webサーバーへのリクエスト数、株価