Upgrade to Pro — share decks privately, control downloads, hide ads and more …

XICA無料統計勉強会(第2回)

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for XICA XICA
October 08, 2014

 XICA無料統計勉強会(第2回)

Avatar for XICA

XICA

October 08, 2014
Tweet

More Decks by XICA

Other Decks in Education

Transcript

  1. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 講師紹介

    p XICAデータアナリスト 二木 皓史(フタキコウシ)   p 略歴    1988.5 静岡県出身    2011.3 慶應義塾大学総合政策学部卒業(竹中平蔵研究会所属)    2013.3 慶應義塾大学大学院経済学研究科卒業(学位:修士(経済学))    2013.4 株式会社XICA入社   p 統計学との関わり    大学学部および大学院で経済学における統計学(計量経済学)を学んでいた   2
  2. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   3
  3. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   4
  4. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     5
  5. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     6
  6. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p 統計学:数量データを使用してデータ全体の性質を言い表したり、データ から法則性を導き出す学問     p 平均:最も基本的な代表値   p 分散:データのバラツキ具合   p 標準偏差:平均的な平均値からのバラツキ具合 7
  7. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p Aさん、Bさん、Cさんはすごかったのか? 8 64   65   66   67   68   69   70   71   72   73   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  8. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p Aさん、Bさん、Cさんはすごかったのか?    平均が入ることで、全体的に良い方だったか悪い方だったかが分かる 9 64   65   66   67   68   69   70   71   72   73   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  9. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 前回のおさらい

    p Aさん、Bさん、Cさんはすごかったのか?    平均が入ることで、全体的に良い方だったか悪い方だったかが分かる    平均と標準偏差を用いることで、すごかった(あるいはすごく悪かった)か否かが わかる   10 64   65   66   67   68   69   70   71   72   73   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  10. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   11
  11. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 今回のゴール

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     12
  12. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 今回のゴール

    p 統計学でこんなことが分かる!    例1:テストの点数が70点だった。これってすごいの?   →平均、分散、標準偏差(第1回)      例2:商品の価格と売り上げって関係しているの?   →相関分析(第2回)      例3:商品の価格を1円上げるとどれだけ売上は落ちるの?   →回帰分析(第3回)    例4:ビジネスで説得的なプレゼンをするには?   →ビジネス統計(第4回)     13
  13. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   14
  14. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 推定:与えられたデータから、これから起こりうることを推測すること   p 例:前回のテストの例    平均70点、標準偏差2.19点 15 64   66   68   70   72   74   76   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  15. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 推定:与えられたデータから、これから起こりうることを推測すること   p 例:前回のテストの例    平均70点、標準偏差2.19点 16 64   66   68   70   72   74   76   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数
  16. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 推定:与えられたデータから、これから起こりうることを推測すること   p 例:前回のテストの例    平均70点、標準偏差2.19点 17 64   66   68   70   72   74   76   Aさん Bさん Cさん Aさん、Bさん、Cさんの英語のテストの点数 標準偏差±2の中に95% のデータが入る
  17. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定

    p 上例の場合、「ほとんど(約95%)の値が65.62〜74.38点の間に 入るだろう」と言うことができる   →これを区間推定という 18
  18. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   19
  19. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 検定

    p 検定    推定結果をもって、ある値が普通かどうかを判断すること   p 例:前回のテストの例    前節で、平均70点、標準偏差2.19点より、「ほとんど(約95%)の値が65.62〜 74.38点の間に収まる」という推定ができた    →この、「ほとんど(約95%)の値が65.62〜74.38点の間に収まる」という推定結果 をもって、他の値が普通かどうかを判断(検定)することができる   20
  20. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 検定

    p 例:前回のテストの例における、Dさん、Eさん、Fさんのテストの点数    Dさん=73点、Eさん=65点、Fさん=70点    DさんとFさんは普通だが、Eさんは普通じゃない(デキが非常に悪い)   21 64   66   68   70   72   74   76   Dさん Eさん Fさん Aさん、Bさん、Cさんの英語のテストの点数
  21. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 推定と検定の応用

    p 例題    あるサイトの平均滞在時間は1分20秒、標準偏差15秒だった。サイト作成者は、 もっと平均滞在時間を延ばしたいと思い、サイトを改良したところ、平均滞在時間 は1分40秒となった。このとき、サイトの改良に効果があったと判断できるか?   p 解答   1.  推定を使う   ü  「標準偏差±2の中に95%のデータが入る」   ü  この場合、「50秒〜1分50秒の間に95%のデータが入る」と判断 する   2.  検定を使う   ü  推定結果「50秒〜1分50秒の間に95%のデータが入る」を使用   ü  サイト改良後は1分40秒   ü  →効果があったとは判断できない   22
  22. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   23
  23. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p これまで学んできた内容は、一つの物事に関しての統計的判断だった    例:(Aさん、Bさん、Cさんの)英語のテストの点数   p これから学ぶ内容は、二つの物事の関係性についての統計的判断    例:(Aさん、Bさん、Cさんの)英語のテストの点数と数学のテストの点 数の関係性   p 二つの物事の関連性についての統計的判断は、主に二つ   1.  それぞれ関連(相関)しているか否か→相関分析   2.  関連しているとしたら、どのような関連性か→回帰分析     24
  24. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p これまで学んできた内容は、一つの物事に関しての統計的判断だった    例:(Aさん、Bさん、Cさんの)英語のテストの点数   p これから学ぶ内容は、二つの物事の関係性についての統計的判断    例:(Aさん、Bさん、Cさんの)英語のテストの点数と数学のテストの点 数の関係性   p 二つの物事の関連性についての統計的判断は、主に二つ   1.  それぞれ関連(相関)しているか否か→相関分析   2.  関連しているとしたら、どのような関連性か→回帰分析     25
  25. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 相関分析    相関関係を明らかにする分析。すなわち、二つの物事の関 連性がどのくらいあるのかについて明らかにする    例:価格と売上は関係しているのか?   26 価格 売上 ?  
  26. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 相関係数(r)    相関関係の度合い    −1〜+1の間の値を取る    絶対値が大きければ大きいほど、相関していると言える   ü 目安    プラスなら正の相関関係(一方の値が高いと、もう一方の値も概して高くなる)    マイナスなら負の相関関係(一方の値が高いと、もう一方の値は概して低くなる)   27 相関係数 相関関係の強さ 0.7<|r| 強い相関関係がある 0.4<|r|≦0.7 相関関係がある 0.2<|r|≦ 弱い相関関係がある |r|≦0.2 相関関係がない  
  27. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 例:たまご1パックの価格と売上パック数は相関しているのか? 28 A店 B店 日にち 値段(円) 売上パック 数(個) 値段(円) 売上パック 数(個) 10/1 250 1 250 10 10/2 245 16 245 12 10/3 255 9 255 9 10/4 260 11 265 7 10/5 275 9 275 4 10/6 230 4 235 15 10/7 225 8 225 16 10/8 240 10 240 11 10/9 270 3 260 10 10/10 245 6 270 7
  28. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 例:たまご1パックの価格と売上パック数は相関しているのか? 29 0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) A店   0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) B店  
  29. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p 例:たまご1パックの価格と売上パック数は相関しているのか? 30 0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) A店   0   2   4   6   8   10   12   14   16   18   220   230   240   250   260   270   280   売 上 数 個 値段(円) B店   相関していない (r=-­‐0.02) 相関している (r=-­‐0.96)
  30. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 相関分析

    p Excelでの相関係数の関数    「=correl(変数1,変数2)」 31
  31. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日の流れ

    p 前回のおさらい   p 今回のゴール   p 推定   p 検定   p 相関分析   p 本日のまとめ   32
  32. Copyright  ©  All  rights  reserved  by  XICA,  Co  LTD. 本日のまとめ

    p 推定    与えられたデータから、これから起こりうることを推測すること     「標準偏差±2の中に95%のデータが入る」   p 検定    推定結果をもって、ある値が普通かどうかを判断すること   p 相関分析    相関関係を明らかにする分析。すなわち、二つの物事の関連性がどのくらいある のかについて明らかにする    相関係数   ü 相関関係の度合い   ü −1〜+1の間の値を取る   ü 絶対値が大きければ大きいほど、相関していると言える   ü プラスなら正の相関関係、マイナスなら負の相関関係   33