Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
XICA無料統計勉強会(第1回)
Search
XICA
September 10, 2014
Education
0
180
XICA無料統計勉強会(第1回)
日時:2014/9/10(水)
場所:サイカオフィス
内容:平均・分散・標準偏差
XICA
September 10, 2014
Tweet
Share
More Decks by XICA
See All by XICA
XICA Academy講座説明資料
xica
0
99
XICA Academy Introduction
xica
0
1k
20141203セミナー資料1_基調講演
xica
1
580
20141203セミナー資料2_事例紹介
xica
0
120
XICA無料統計勉強会(第2回)
xica
0
46
20141007_活用事例紹介セミナー投影資料(抜粋)
xica
1
440
【事例発表資料】オープンデータを活用した 週次GDPの独自推計について
xica
1
260
【勉強会資料】XICAのWeb広告におけるサービスについて
xica
0
310
統計分析ツール[ xica adelie ]とは
xica
0
6.7k
Other Decks in Education
See All in Education
Introduction - Lecture 1 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
3k
AWS試験全冠したら新しい道が開けた話
nagisa53
3
1.1k
Analysis and Validation - Lecture 4 - Information Visualisation (4019538FNR)
signer
PRO
0
1.4k
Microsoft Office 365
matleenalaakso
0
1.5k
自己紹介 / who-am-i
yasulab
2
3.1k
Interactive Tabletops and Surfaces - Lecture 7 - Next Generation User Interfaces (4018166FNR)
signer
PRO
1
1.2k
MySmartSTEAM2324
cbtlibrary
0
120
5 занятие. Разбор метода "8 кубиков"бизнес-модели #ideaNN 16.02.2024.
karlov
0
180
WordPressを教える人のための視点と考え方
crebowinfo
0
230
生成AIを活用できる大学教職員になる-基本と実践-
gmoriki
0
290
Canva
matleenalaakso
0
150
令和6年度 無料トライアルキャンペーン説明会
asial_edu
0
720
Featured
See All Featured
Fireside Chat
paigeccino
20
2.6k
Git: the NoSQL Database
bkeepers
PRO
422
63k
Building Applications with DynamoDB
mza
88
5.6k
Become a Pro
speakerdeck
PRO
10
4.5k
StorybookのUI Testing Handbookを読んだ
zakiyama
12
4.6k
RailsConf 2023
tenderlove
2
530
GitHub's CSS Performance
jonrohan
1024
450k
Scaling GitHub
holman
457
140k
Web Components: a chance to create the future
zenorocha
305
41k
Art, The Web, and Tiny UX
lynnandtonic
288
19k
Build The Right Thing And Hit Your Dates
maggiecrowley
23
2k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
220
21k
Transcript
XICA無料統計勉強会 (第1回) 2014/9/10
Copyright © All rights reserved by XICA, Co LTD. 講師紹介
p XICAデータアナリスト 二木 皓史(フタキコウシ) p 略歴 1988.5 静岡県出身 2011.3 慶應義塾大学総合政策学部卒業(竹中平蔵研究会所属) 2013.3 慶應義塾大学大学院経済学研究科卒業(学位:修士(経済学)) 2013.4 株式会社XICA入社 p 統計学との関わり 大学学部および大学院で経済学における統計学(計量経済学)を学んでいた 2
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 3
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 4
Copyright © All rights reserved by XICA, Co LTD. はじめに:勉強会概要
p 回数:計4回(9〜12月の第2水曜日) できれば通して出席していただいた方が体系的に理解できると思いますが、途中 で来れなくても後日弊社ブログで内容を共有して後から学習できるように致しま す。 p 目標:各自が実践できる統計学の基礎的な知識を習得する p 内容スケジュール 第1回(本日):統計学とはなにか、平均、分散、標準偏差 第2回(10/8):相関分析、推定、検定 第3回(11/12):回帰分析 第4回(12/10):統計学の応用(ビジネス、日常) 5
Copyright © All rights reserved by XICA, Co LTD. p はじめに:勉強会概要
p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 6
Copyright © All rights reserved by XICA, Co LTD. 統計学とは何か
p 統計学とは 「確率論を基礎にして、集団全体の性質を一部の標本を調べることによって推定 するための処理・分析方法について研究する学問」 →これじゃよく分からん。 要は、数量データを使用してデータ全体の性質を言い表したり、 データから法則性を導き出す学問 7
Copyright © All rights reserved by XICA, Co LTD. 統計学とは何か
p 統計学でこんなことが分かる! 例1:テストの点数が70点だった。これってすごいの? →平均、分散、標準偏差(第1回) 例2:商品の価格と売り上げって関係しているの? →相関分析(第2回) 例3:商品の価格を1円上げるとどれだけ売上は落ちるの? →回帰分析(第3回) 例4:ビジネスで説得的なプレゼンをするには? →ビジネス統計(第4回) 8
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 9
Copyright © All rights reserved by XICA, Co LTD. 平均
p 平均:統計学における最も基本的な統計的情報 p データ全体の傾向値を”ざっくりと”俯瞰できる 10 0 1 2 3 4 5 6 1回目 2回目 3回目 サイコロの目 サイコロの目
Copyright © All rights reserved by XICA, Co LTD. 平均
p 例題1 Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、71点だった。 この3人の平均点は何点? 11 Aさん Bさん Cさん 平均点 点数 72点 67点 71点
Copyright © All rights reserved by XICA, Co LTD. 平均
p 例題1 Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、71点だった。 この3人の平均点は何点? p 平均の求め方 (値の合計) ÷ (値の数) 12 Aさん Bさん Cさん 平均点 点数 72点 67点 71点 70点
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 13
Copyright © All rights reserved by XICA, Co LTD. 分散
p 例題2 例題1では、Aさん、Bさん、Cさんの英語のテストの点数がそれぞれ72点、67点、 71点で平均が70点だったが、Dさん、Eさん、Fさんはそれぞれ86点、59点、65点で 同じく平均が70点だった。これらは同じ特徴を持つデータと見なして良いか? 解答:良くない。データのバラツキが異なるため。 →データのバラツキを表す指標が必要 14 Aさん Bさん Cさん 平均点 点数 72点 67点 71点 70点 Dさん Eさん Fさん 平均点 点数 86点 59点 65点 70点
Copyright © All rights reserved by XICA, Co LTD. 分散
p データのばらつきを表す指標を分散という p 定義 (※nは値の数) つまり、平均値からのバラツキ具合と定義して分散を計算している 15
Copyright © All rights reserved by XICA, Co LTD. 分散
p 例題2での分散は? Aさん、Bさん、Cさんのグループの分散 Dさん、Eさん、Fさんのグループの分散 16 72 − 70 ( )2 + 67− 70 ( )2 + 71− 70 ( )2 3 = 4.78 86 − 70 ( )2 + 59 − 70 ( )2 + 65− 70 ( )2 3 =134
Copyright © All rights reserved by XICA, Co LTD. 分散
p Q:なんでわざわざ平均値と値の差を二乗するの? p A:二乗しないとおかしな結果になってしまうから p 先程の事例を二乗しないで計算してみると・・・ 17 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数 +2 +1 -‐3
Copyright © All rights reserved by XICA, Co LTD. 分散
p Q:なんでわざわざ平均値と値の差を二乗するの? p A:二乗しないとおかしな結果になってしまうから p 先程の事例を二乗しないで計算してみると・・・ 18 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数 +2 +1 2+(-‐3)+1=0(?!) -‐3
Copyright © All rights reserved by XICA, Co LTD. 分散
p 分散の問題点 分散は二乗して足すので値が大きくなってしまう とりわけ、(ばらつきを表す指標であったとしても)「平均的な離れ具合」の指標で はない →標準偏差の出番 19
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 20
Copyright © All rights reserved by XICA, Co LTD. 標準偏差
p 「平均値からの平均的な離れ具合」の指標にするためには、ルート(√)を つける 分散は作成段階で二乗して足したため p この、分散にルートをつけた値を標準偏差という p 例題2の標準偏差は? Aさん、Bさん、Cさんのグループの標準偏差 Dさん、Eさん、Fさんのグループの標準偏差 21 4.78 = 2.19 134 =11.58
Copyright © All rights reserved by XICA, Co LTD. 分散と標準偏差まとめ
p 分散と標準偏差は双子と考えて良い 表し方が違うだけ p しかしながら、標準偏差が「平均的な平均値からの離れ具合」を表してい るため、標準偏差の方が直感的で理解されやすい 22
Copyright © All rights reserved by XICA, Co LTD. 本日の流れ
p はじめに:勉強会概要 p 統計学とは何か p 平均 p 分散 p 標準偏差 p 本日のまとめ 23
Copyright © All rights reserved by XICA, Co LTD. 統計学とは何か
p 統計学でこんなことが分かる! 例1:テストの点数が70点だった。これってすごいの? →平均、分散、標準偏差(第1回) 例2:商品の価格と売り上げって関係しているの? →相関分析(第2回) 例3:商品の価格を1円上げるとどれだけ売上は落ちるの? →回帰分析(第3回) 例4:ビジネスで説得的なプレゼンをするには? →ビジネス統計(第4回) 24
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p Aさん、Bさん、Cさんはすごかったのか? 25 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p Aさん、Bさん、Cさんはすごかったのか? 平均が入ることで、全体的に良い方だったか悪い方だったかが分かる 26 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p Aさん、Bさん、Cさんはすごかったのか? 平均が入ることで、全体的に良い方だったか悪い方だったかが分かる 平均と標準偏差を用いることで、すごかった(あるいはすごく悪かった)か否かが わかる 27 64 65 66 67 68 69 70 71 72 73 A君 B君 C君 Aさん、Bさん、Cさんの英語のテストの点数
Copyright © All rights reserved by XICA, Co LTD. 本日のまとめ
p 統計学:数量データを使用してデータ全体の性質を言い表したり、データ から法則性を導き出す学問 今日の内容は、データ全体の性質を言い表す部分を学習 p 平均:最も基本的な代表値 p 分散:データのばらつき具合 p 標準偏差:平均的な平均値からのばらつき具合 28