Upgrade to Pro — share decks privately, control downloads, hide ads and more …

XICA無料統計勉強会(第1回)

XICA
September 10, 2014

 XICA無料統計勉強会(第1回)

日時:2014/9/10(水)
場所:サイカオフィス
内容:平均・分散・標準偏差

XICA

September 10, 2014
Tweet

More Decks by XICA

Other Decks in Education

Transcript

  1. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 講師紹介

    p XICAデータアナリスト 二木 皓史(フタキコウシ)   p 略歴    1988.5 静岡県出身    2011.3 慶應義塾大学総合政策学部卒業(竹中平蔵研究会所属)    2013.3 慶應義塾大学大学院経済学研究科卒業(学位:修士(経済学))    2013.4 株式会社XICA入社   p 統計学との関わり    大学学部および大学院で経済学における統計学(計量経済学)を学んでいた   2
  2. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p はじめに:勉強会概要   p 統計学とは何か   p 平均   p 分散   p 標準偏差   p 本日のまとめ   3
  3. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p はじめに:勉強会概要   p 統計学とは何か   p 平均   p 分散   p 標準偏差   p 本日のまとめ   4
  4. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. はじめに:勉強会概要

    p 回数:計4回(9〜12月の第2水曜日)    できれば通して出席していただいた方が体系的に理解できると思いますが、途中 で来れなくても後日弊社ブログで内容を共有して後から学習できるように致しま す。   p 目標:各自が実践できる統計学の基礎的な知識を習得する   p 内容スケジュール    第1回(本日):統計学とはなにか、平均、分散、標準偏差    第2回(10/8):相関分析、推定、検定    第3回(11/12):回帰分析    第4回(12/10):統計学の応用(ビジネス、日常)   5
  5. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. p はじめに:勉強会概要

      p 統計学とは何か   p 平均   p 分散   p 標準偏差   p 本日のまとめ   6
  6. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 統計学とは何か

    p 統計学とは    「確率論を基礎にして、集団全体の性質を一部の標本を調べることによって推定 するための処理・分析方法について研究する学問」   →これじゃよく分からん。    要は、数量データを使用してデータ全体の性質を言い表したり、 データから法則性を導き出す学問   7
  7. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 統計学とは何か

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     8
  8. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p はじめに:勉強会概要   p 統計学とは何か   p 平均   p 分散   p 標準偏差   p 本日のまとめ   9
  9. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 平均

    p 平均:統計学における最も基本的な統計的情報   p データ全体の傾向値を”ざっくりと”俯瞰できる   10 0   1   2   3   4   5   6   1回目 2回目 3回目 サイコロの目 サイコロの目
  10. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 平均

    p 例題1    Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、71点だった。 この3人の平均点は何点?   11 Aさん Bさん Cさん 平均点 点数 72点 67点 71点
  11. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 平均

    p 例題1    Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、71点だった。 この3人の平均点は何点?   p 平均の求め方   (値の合計) ÷ (値の数)   12 Aさん Bさん Cさん 平均点 点数 72点 67点 71点 70点
  12. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p はじめに:勉強会概要   p 統計学とは何か   p 平均   p 分散   p 標準偏差   p 本日のまとめ   13
  13. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 分散

    p 例題2    例題1では、Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、 71点で平均が70点だったが、Dさん、Eさん、Fさんはそれぞれ86点、59点、65点で 同じく平均が70点だった。これらは同じ特徴を持つデータと見なして良いか?    解答:良くない。データのバラツキが異なるため。   →データのバラツキを表す指標が必要   14 Aさん Bさん Cさん 平均点 点数 72点 67点 71点 70点 Dさん Eさん Fさん 平均点 点数 86点 59点 65点 70点
  14. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 分散

    p データのばらつきを表す指標を分散という   p 定義   (※nは値の数)    つまり、平均値からのバラツキ具合と定義して分散を計算している   15
  15. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 分散

    p 例題2での分散は?    Aさん、Bさん、Cさんのグループの分散    Dさん、Eさん、Fさんのグループの分散   16 72 − 70 ( )2 + 67− 70 ( )2 + 71− 70 ( )2 3 = 4.78 86 − 70 ( )2 + 59 − 70 ( )2 + 65− 70 ( )2 3 =134
  16. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 分散

    p Q:なんでわざわざ平均値と値の差を二乗するの?   p A:二乗しないとおかしな結果になってしまうから   p 先程の事例を二乗しないで計算してみると・・・     17 64   65   66   67   68   69   70   71   72   73   A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数 +2 +1 -­‐3
  17. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 分散

    p Q:なんでわざわざ平均値と値の差を二乗するの?   p A:二乗しないとおかしな結果になってしまうから   p 先程の事例を二乗しないで計算してみると・・・     18 64   65   66   67   68   69   70   71   72   73   A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数 +2 +1 2+(-­‐3)+1=0(?!) -­‐3
  18. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 分散

    p 分散の問題点    分散は二乗して足すので値が大きくなってしまう    とりわけ、(ばらつきを表す指標であったとしても)「平均的な離れ具合」の指標で はない   →標準偏差の出番   19
  19. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p はじめに:勉強会概要   p 統計学とは何か   p 平均   p 分散   p 標準偏差   p 本日のまとめ     20
  20. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 標準偏差

    p 「平均値からの平均的な離れ具合」の指標にするためには、ルート(√)を つける    分散は作成段階で二乗して足したため   p この、分散にルートをつけた値を標準偏差という   p 例題2の標準偏差は?    Aさん、Bさん、Cさんのグループの標準偏差    Dさん、Eさん、Fさんのグループの標準偏差   21 4.78 = 2.19 134 =11.58
  21. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 分散と標準偏差まとめ

    p 分散と標準偏差は双子と考えて良い    表し方が違うだけ   p しかしながら、標準偏差が「平均的な平均値からの離れ具合」を表してい るため、標準偏差の方が直感的で理解されやすい   22
  22. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p はじめに:勉強会概要   p 統計学とは何か   p 平均   p 分散   p 標準偏差   p 本日のまとめ   23
  23. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 統計学とは何か

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     24
  24. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日のまとめ

    p Aさん、Bさん、Cさんはすごかったのか? 25 64   65   66   67   68   69   70   71   72   73   A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
  25. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日のまとめ

    p Aさん、Bさん、Cさんはすごかったのか?    平均が入ることで、全体的に良い方だったか悪い方だったかが分かる 26 64   65   66   67   68   69   70   71   72   73   A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
  26. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日のまとめ

    p Aさん、Bさん、Cさんはすごかったのか?    平均が入ることで、全体的に良い方だったか悪い方だったかが分かる    平均と標準偏差を用いることで、すごかった(あるいはすごく悪かった)か否かが わかる   27 64   65   66   67   68   69   70   71   72   73   A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
  27. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日のまとめ

    p 統計学:数量データを使用してデータ全体の性質を言い表したり、データ から法則性を導き出す学問    今日の内容は、データ全体の性質を言い表す部分を学習   p 平均:最も基本的な代表値   p 分散:データのばらつき具合   p 標準偏差:平均的な平均値からのばらつき具合 28