Upgrade to Pro — share decks privately, control downloads, hide ads and more …

XICA無料統計勉強会(第2回)

XICA
October 08, 2014

 XICA無料統計勉強会(第2回)

XICA

October 08, 2014
Tweet

More Decks by XICA

Other Decks in Education

Transcript

  1. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 講師紹介

    p XICAデータアナリスト 二木 皓史(フタキコウシ)   p 略歴    1988.5 静岡県出身    2011.3 慶應義塾大学総合政策学部卒業(竹中平蔵研究会所属)    2013.3 慶應義塾大学大学院経済学研究科卒業(学位:修士(経済学))    2013.4 株式会社XICA入社   p 統計学との関わり    大学学部および大学院で経済学における統計学(計量経済学)を学んでいた   2
  2. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   3
  3. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   4
  4. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     5
  5. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     6
  6. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p 統計学:数量データを使用してデータ全体の性質を言い表したり、データ から法則性を導き出す学問     p 平均:最も基本的な代表値   p 分散:データのバラツキ具合   p 標準偏差:平均的な平均値からのバラツキ具合 7
  7. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p Aさん、Bさん、Cさんはすごかったのか? 8 64   65   66   67   68   69   70   71   72   73   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  8. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p Aさん、Bさん、Cさんはすごかったのか?    平均が入ることで、全体的に良い方だったか悪い方だったかが分かる 9 64   65   66   67   68   69   70   71   72   73   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  9. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p Aさん、Bさん、Cさんはすごかったのか?    平均が入ることで、全体的に良い方だったか悪い方だったかが分かる    平均と標準偏差を用いることで、すごかった(あるいはすごく悪かった)か否かが わかる   10 64   65   66   67   68   69   70   71   72   73   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  10. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   11
  11. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 今回のゴール

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     12
  12. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 今回のゴール

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     13
  13. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   14
  14. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 推定:与えられたデータから、これから起こりうることを推測すること   p 例:前回のテストの例    平均70点、標準偏差2.19点 15 64   66   68   70   72   74   76   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  15. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 推定:与えられたデータから、これから起こりうることを推測すること   p 例:前回のテストの例    平均70点、標準偏差2.19点 16 64   66   68   70   72   74   76   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  16. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 推定:与えられたデータから、これから起こりうることを推測すること   p 例:前回のテストの例    平均70点、標準偏差2.19点 17 64   66   68   70   72   74   76   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数 標準偏差±2の中に95% のデータが入る
  17. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 上例の場合、「ほとんど(約95%)の値が65.62〜74.38点の間に 入るだろう」と言うことができる   →これを区間推定という 18
  18. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   19
  19. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 検定

    p 検定    推定結果をもって、ある値が普通かどうかを判断すること   p 例:前回のテストの例    前節で、平均70点、標準偏差2.19点より、「ほとんど(約95%)の値が65.62〜 74.38点の間に収まる」という推定ができた    →この、「ほとんど(約95%)の値が65.62〜74.38点の間に収まる」という推定結果 をもって、他の値が普通かどうかを判断(検定)することができる   20
  20. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 検定

    p 例:前回のテストの例における、Dさん、Eさん、Fさんのテストの点数    Dさん=73点、Eさん=65点、Fさん=70点    DさんとFさんは普通だが、Eさんは普通じゃない(デキが非常に悪い)   21 64   66   68   70   72   74   76   Dさん Eさん Fさん Aさん、Bさん、Cさんの英語のテストの点数
  21. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定と検定の応用

    p 例題    あるサイトの平均滞在時間は1分20秒、標準偏差15秒だった。サイト作成者は、 もっと平均滞在時間を延ばしたいと思い、サイトを改良したところ、平均滞在時間 は1分40秒となった。このとき、サイトの改良に効果があったと判断できるか?   p 解答   1.  推定を使う   ü  「標準偏差±2の中に95%のデータが入る」   ü  この場合、「50秒〜1分50秒の間に95%のデータが入る」と判断 する   2.  検定を使う   ü  推定結果「50秒〜1分50秒の間に95%のデータが入る」を使用   ü  サイト改良後は1分40秒   ü  →効果があったとは判断できない   22
  22. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   23
  23. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p これまで学んできた内容は、一つの物事に関しての統計的判断だった    例:(Aさん、Bさん、Cさんの)英語のテストの点数   p これから学ぶ内容は、二つの物事の関係性についての統計的判断    例:(Aさん、Bさん、Cさんの)英語のテストの点数と数学のテストの点 数の関係性   p 二つの物事の関連性についての統計的判断は、主に二つ   1.  それぞれ関連(相関)しているか否か→相関分析   2.  関連しているとしたら、どのような関連性か→回帰分析     24
  24. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p これまで学んできた内容は、一つの物事に関しての統計的判断だった    例:(Aさん、Bさん、Cさんの)英語のテストの点数   p これから学ぶ内容は、二つの物事の関係性についての統計的判断    例:(Aさん、Bさん、Cさんの)英語のテストの点数と数学のテストの点 数の関係性   p 二つの物事の関連性についての統計的判断は、主に二つ   1.  それぞれ関連(相関)しているか否か→相関分析   2.  関連しているとしたら、どのような関連性か→回帰分析     25
  25. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 相関分析    相関関係を明らかにする分析。すなわち、二つの物事の関 連性がどのくらいあるのかについて明らかにする    例:価格と売上は関係しているのか?   26 価格 売上 ?  
  26. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 相関係数(r)    相関関係の度合い    −1〜+1の間の値を取る    絶対値が大きければ大きいほど、相関していると言える   ü 目安    プラスなら正の相関関係(一方の値が高いと、もう一方の値も概して高くなる)    マイナスなら負の相関関係(一方の値が高いと、もう一方の値は概して低くなる)   27 相関係数 相関関係の強さ 0.7<|r| 強い相関関係がある 0.4<|r|≦0.7 相関関係がある 0.2<|r|≦ 弱い相関関係がある |r|≦0.2 相関関係がない  
  27. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 例:たまご1パックの価格と売上パック数は相関しているのか? 28 A店 B店 日にち 値段(円) 売上パック 数(個) 値段(円) 売上パック 数(個) 10/1 250 1 250 10 10/2 245 16 245 12 10/3 255 9 255 9 10/4 260 11 265 7 10/5 275 9 275 4 10/6 230 4 235 15 10/7 225 8 225 16 10/8 240 10 240 11 10/9 270 3 260 10 10/10 245 6 270 7
  28. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 例:たまご1パックの価格と売上パック数は相関しているのか? 29 0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) A店   0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) B店  
  29. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 例:たまご1パックの価格と売上パック数は相関しているのか? 30 0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) A店   0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) B店   相関していない (r=-­‐0.02) 相関している (r=-­‐0.96)
  30. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p Excelでの相関係数の関数    「=correl(変数1,変数2)」 31
  31. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   32
  32. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日のまとめ

    p 推定    与えられたデータから、これから起こりうることを推測すること     「標準偏差±2の中に95%のデータが入る」   p 検定    推定結果をもって、ある値が普通かどうかを判断すること   p 相関分析    相関関係を明らかにする分析。すなわち、二つの物事の関連性がどのくらいある のかについて明らかにする    相関係数   ü 相関関係の度合い   ü −1〜+1の間の値を取る   ü 絶対値が大きければ大きいほど、相関していると言える   ü プラスなら正の相関関係、マイナスなら負の相関関係   33