Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
XICA無料統計勉強会(第1回)
Search
XICA
September 10, 2014
Education
0
180
XICA無料統計勉強会(第1回)
日時:2014/9/10(水)
場所:サイカオフィス
内容:平均・分散・標準偏差
XICA
September 10, 2014
Tweet
Share
More Decks by XICA
See All by XICA
XICA Academy講座説明資料
xica
0
100
XICA Academy Introduction
xica
0
1k
20141203セミナー資料1_基調講演
xica
1
580
20141203セミナー資料2_事例紹介
xica
0
120
XICA無料統計勉強会(第2回)
xica
0
46
20141007_活用事例紹介セミナー投影資料(抜粋)
xica
1
440
【事例発表資料】オープンデータを活用した 週次GDPの独自推計について
xica
1
260
【勉強会資料】XICAのWeb広告におけるサービスについて
xica
0
310
統計分析ツール[ xica adelie ]とは
xica
0
6.7k
Other Decks in Education
See All in Education
Introduction - Lecture 1 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
3.1k
Information Architectures - Lecture 2 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.1k
Microsoft Office 365
matleenalaakso
0
1.5k
[SemanaX-UFCG-2024] Guia descomplicado de entrevistas FAANG
hugaomarques
2
460
Before You Create Something
nandenjin
0
110
合理的配慮を知るワークショップ/Understanding Reasonable Accommodations (Workshop)
freee
2
1.5k
Interactive Tabletops and Surfaces - Lecture 7 - Next Generation User Interfaces (4018166FNR)
signer
PRO
1
1.2k
Sähköiset kyselyt, kokeet ja arviointi
matleenalaakso
1
16k
Tips for the Presentation - Lecture 2 - Advanced Topics in Big Data (4023256FNR)
signer
PRO
0
130
Project Sprint 学生版(入門編)
copilot
PRO
0
190
SUMMER SCHOOL 2024
pnuslide
0
150
Data Representation - Lecture 3 - Information Visualisation (4019538FNR)
signer
PRO
1
1.7k
Featured
See All Featured
Statistics for Hackers
jakevdp
790
220k
The Cost Of JavaScript in 2023
addyosmani
20
3.9k
What’s in a name? Adding method to the madness
productmarketing
PRO
17
2.7k
A better future with KSS
kneath
231
16k
Fashionably flexible responsive web design (full day workshop)
malarkey
398
65k
Writing Fast Ruby
sferik
622
60k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
65
14k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
33
6k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
22
1.6k
StorybookのUI Testing Handbookを読んだ
zakiyama
13
4.6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
8
1.3k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
14
1.5k
Transcript
XICA無料統計勉強会 (第1回) 2014/9/10
Copyright © All rights reserved by XICA, Co LTD. 講師紹介
p XICAデータアナリスト 二木 皓史(フタキコウシ) p 略歴 1988.5 静岡県出身 2011.3 慶應義塾大学総合政策学部卒業(竹中平蔵研究会所属) 2013.3 慶應義塾大学大学院経済学研究科卒業(学位:修士(経済学)) 2013.4 株式会社XICA入社 p 統計学との関わり 大学学部および大学院で経済学における統計学(計量経済学)を学んでいた 2
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 3
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 4
Copyright © All rights reserved by XICA, Co LTD. はじめに:勉強会概要
p 回数:計4回(9〜12月の第2水曜日) できれば通して出席していただいた方が体系的に理解できると思いますが、途中 で来れなくても後日弊社ブログで内容を共有して後から学習できるように致しま す。 p 目標:各自が実践できる統計学の基礎的な知識を習得する p 内容スケジュール 第1回(本日):統計学とはなにか、平均、分散、標準偏差 第2回(10/8):相関分析、推定、検定 第3回(11/12):回帰分析 第4回(12/10):統計学の応用(ビジネス、日常) 5
Copyright © All rights reserved by XICA, Co LTD. p はじめに:勉強会概要
p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 6
Copyright © All rights reserved by XICA, Co LTD. 統計学とは何か
p 統計学とは 「確率論を基礎にして、集団全体の性質を一部の標本を調べることによって推定 するための処理・分析方法について研究する学問」 →これじゃよく分からん。 要は、数量データを使用してデータ全体の性質を言い表したり、 データから法則性を導き出す学問 7
Copyright © All rights reserved by XICA, Co LTD. 統計学とは何か
p 統計学でこんなことが分かる! 例1:テストの点数が70点だった。これってすごいの? →平均、分散、標準偏差(第1回) 例2:商品の価格と売り上げって関係しているの? →相関分析(第2回) 例3:商品の価格を1円上げるとどれだけ売上は落ちるの? →回帰分析(第3回) 例4:ビジネスで説得的なプレゼンをするには? →ビジネス統計(第4回) 8
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 9
Copyright © All rights reserved by XICA, Co LTD. 平均
p 平均:統計学における最も基本的な統計的情報 p データ全体の傾向値を”ざっくりと”俯瞰できる 10 0 1 2 3 4 5 6 1回目 2回目 3回目 サイコロの目 サイコロの目
Copyright © All rights reserved by XICA, Co LTD. 平均
p 例題1 Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、71点だった。 この3人の平均点は何点? 11 Aさん Bさん Cさん 平均点 点数 72点 67点 71点
Copyright © All rights reserved by XICA, Co LTD. 平均
p 例題1 Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、71点だった。 この3人の平均点は何点? p 平均の求め方 (値の合計) ÷ (値の数) 12 Aさん Bさん Cさん 平均点 点数 72点 67点 71点 70点
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 13
Copyright © All rights reserved by XICA, Co LTD. 分散
p 例題2 例題1では、Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、 71点で平均が70点だったが、Dさん、Eさん、Fさんはそれぞれ86点、59点、65点で 同じく平均が70点だった。これらは同じ特徴を持つデータと見なして良いか? 解答:良くない。データのバラツキが異なるため。 →データのバラツキを表す指標が必要 14 Aさん Bさん Cさん 平均点 点数 72点 67点 71点 70点 Dさん Eさん Fさん 平均点 点数 86点 59点 65点 70点
Copyright © All rights reserved by XICA, Co LTD. 分散
p データのばらつきを表す指標を分散という p 定義 (※nは値の数) つまり、平均値からのバラツキ具合と定義して分散を計算している 15
Copyright © All rights reserved by XICA, Co LTD. 分散
p 例題2での分散は? Aさん、Bさん、Cさんのグループの分散 Dさん、Eさん、Fさんのグループの分散 16 72 − 70 ( )2 + 67− 70 ( )2 + 71− 70 ( )2 3 = 4.78 86 − 70 ( )2 + 59 − 70 ( )2 + 65− 70 ( )2 3 =134
Copyright © All rights reserved by XICA, Co LTD. 分散
p Q:なんでわざわざ平均値と値の差を二乗するの? p A:二乗しないとおかしな結果になってしまうから p 先程の事例を二乗しないで計算してみると・・・ 17 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数 +2 +1 -‐3
Copyright © All rights reserved by XICA, Co LTD. 分散
p Q:なんでわざわざ平均値と値の差を二乗するの? p A:二乗しないとおかしな結果になってしまうから p 先程の事例を二乗しないで計算してみると・・・ 18 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数 +2 +1 2+(-‐3)+1=0(?!) -‐3
Copyright © All rights reserved by XICA, Co LTD. 分散
p 分散の問題点 分散は二乗して足すので値が大きくなってしまう とりわけ、(ばらつきを表す指標であったとしても)「平均的な離れ具合」の指標で はない →標準偏差の出番 19
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 20
Copyright © All rights reserved by XICA, Co LTD. 標準偏差
p 「平均値からの平均的な離れ具合」の指標にするためには、ルート(√)を つける 分散は作成段階で二乗して足したため p この、分散にルートをつけた値を標準偏差という p 例題2の標準偏差は? Aさん、Bさん、Cさんのグループの標準偏差 Dさん、Eさん、Fさんのグループの標準偏差 21 4.78 = 2.19 134 =11.58
Copyright © All rights reserved by XICA, Co LTD. 分散と標準偏差まとめ
p 分散と標準偏差は双子と考えて良い 表し方が違うだけ p しかしながら、標準偏差が「平均的な平均値からの離れ具合」を表してい るため、標準偏差の方が直感的で理解されやすい 22
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 23
Copyright © All rights reserved by XICA, Co LTD. 統計学とは何か
p 統計学でこんなことが分かる! 例1:テストの点数が70点だった。これってすごいの? →平均、分散、標準偏差(第1回) 例2:商品の価格と売り上げって関係しているの? →相関分析(第2回) 例3:商品の価格を1円上げるとどれだけ売上は落ちるの? →回帰分析(第3回) 例4:ビジネスで説得的なプレゼンをするには? →ビジネス統計(第4回) 24
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p Aさん、Bさん、Cさんはすごかったのか? 25 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p Aさん、Bさん、Cさんはすごかったのか? 平均が入ることで、全体的に良い方だったか悪い方だったかが分かる 26 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p Aさん、Bさん、Cさんはすごかったのか? 平均が入ることで、全体的に良い方だったか悪い方だったかが分かる 平均と標準偏差を用いることで、すごかった(あるいはすごく悪かった)か否かが わかる 27 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p 統計学:数量データを使用してデータ全体の性質を言い表したり、データ から法則性を導き出す学問 今日の内容は、データ全体の性質を言い表す部分を学習 p 平均:最も基本的な代表値 p 分散:データのばらつき具合 p 標準偏差:平均的な平均値からのばらつき具合 28