Slide 1

Slide 1 text

統計とは? 2020年01月23日

Slide 2

Slide 2 text

Kazuya Araki 株式会社ビズリーチ Data Analyst / Data Archtect ● ビズリーチサービスのデータ分析、施策立案 ● データ分析基盤設計、運用保守 ● データ人材育成、アドバイザー すきなこと ● データをみること ● 本 ● 邦ロック ● スノースポーツ (Skiing, Snowboarding, Hiking in the snow etc...) @kazuya_araki_jp jedi_trickstar

Slide 3

Slide 3 text

普段はこんなことしています

Slide 4

Slide 4 text

普段はこんなことしています

Slide 5

Slide 5 text

今となってはこんな私ですが

Slide 6

Slide 6 text

高校時代は数学が苦手 高校3年 前期期末テスト結果

Slide 7

Slide 7 text

高校時代は数学が苦手😇 高校3年 前期期末テスト結果

Slide 8

Slide 8 text

浪人、大学と経て、普通に 優(80~100点): 37科目 / 73単位 良(65~79点): 25科目 / 52単位 可(50~64点): 16科目 / 31単位 不可(50点未満): 0科目 / 0単位 GPA概算(優を3.5とする): (3.5 * 73 + 3 * 52 + 2 * 31 + 1 * 0) / (73 + 52 + 31 + 0) = 473.5 / 156 ≒ 3.0 大学 成績証明書

Slide 9

Slide 9 text

浪人、大学と経て、普通に😎✌ 優(80~100点): 37科目 / 73単位 良(65~79点): 25科目 / 52単位 可(50~64点): 16科目 / 31単位 不可(50点未満): 0科目 / 0単位 GPA概算(優を3.5とする): (3.5 * 73 + 3 * 52 + 2 * 31 + 1 * 0) / (73 + 52 + 31 + 0) = 473.5 / 156 ≒ 3.0 大学 成績証明書

Slide 10

Slide 10 text

ということで、本題入ります

Slide 11

Slide 11 text

No content

Slide 12

Slide 12 text

No content

Slide 13

Slide 13 text

No content

Slide 14

Slide 14 text

jedi_trickstar

Slide 15

Slide 15 text

統計とは? 2020年01月23日

Slide 16

Slide 16 text

統計ってなんだろう?🤔 What is "Statistics"?

Slide 17

Slide 17 text

統計データの使われ方を見てみましょう

Slide 18

Slide 18 text

①省庁データの使われ方 1. How to use Government data

Slide 19

Slide 19 text

https://www.huffingtonpost.jp/entry/story_jp_5e1ea82ac5b63211760b21c0

Slide 20

Slide 20 text

20代のパスポートの新規取得率は低迷している (記事引用) 観光庁がまとめた、2019年1月の「若者のアウトバウンド推進実行会議」の資料による と、日本の20代(20〜29歳)の出国者数は、2000年までは400万人を超えていたものの、 2017年は305万人に留まった。もちろん少子化の影響もあるが、それだけではない。 20代のパスポートの新規取得率は、1995年に9.5%だったものが、2003年には5%に落ち 込み、その後、6%前後で推移。2017年には若干上昇したものの、6.9%だ。取得率で見れ ば、明らかに低迷している。 同じ資料によると、海外旅行に「とても行きたい」と答えた若者は45.1%、「まあまあ行 きたい」の22.6%を合わせると、7割近くになる。決して興味がないわけではないようだ。 他方、「あまり行きたくない」「行きたくない」と答えた若者たちの理由は「怖い・治安が 悪い」が35.5%、「言葉が通じない」が19.7%だった。

Slide 21

Slide 21 text

20代のパスポートの新規取得率は低迷している https://www.mlit.go.jp/common/001270463.pdf

Slide 22

Slide 22 text

②弊社のデータの使い方 2. How to use BizReach data

Slide 23

Slide 23 text

Q. 転職希望者はやはり年々増えているのか Thanks! Nakamura Hanako san

Slide 24

Slide 24 text

A. 会員数は増加傾向 CONFIDENTIAL ビズリーチサービスデータ: 累計登録会員数

Slide 25

Slide 25 text

A. 転職が決まった人も増加傾向 ビズリーチサービスデータ: 月別成約数 CONFIDENTIAL

Slide 26

Slide 26 text

Q. 現在需要のある職業 Thanks! Nakamura Hanako san Q. 今需要が高い仕事とは? Thanks! UMEBAYASHI Kyosuke san

Slide 27

Slide 27 text

A. IT関連職の需要が高い CONFIDENTIAL ビズリーチサービスデータ: 業種別成約数(2019年)

Slide 28

Slide 28 text

③メディアのデータの使い方 3. How to use Mass media data

Slide 29

Slide 29 text

Q. AIなどの影響が職にどのような影響を与え、 どのような対策を取ろうと考えているか? Thanks! UMEBAYASHI Kyosuke san

Slide 30

Slide 30 text

X-Tech = 既存のビジネスにテクノロジーを活用する時代 https://www.nikkei.com/article/DGKKZO43151540Q9A330C1EA5000/

Slide 31

Slide 31 text

X-Tech = 既存のビジネスにテクノロジーを活用する時代 https://www.nikkei.com/article/DGKKZO43151540Q9A330C1EA5000/ 不動産 × IT = RealTech 金融 × IT = FinTech cf. 医療 × IT = HealthCareTech 農業 × IT = AgriTech 広告 × IT = AdTech 教育 × IT = EdTech マーケティング × IT = MarTech

Slide 32

Slide 32 text

様々なところで使われていますね🙄

Slide 33

Slide 33 text

ところで...

Slide 34

Slide 34 text

話は変わりますが、

Slide 35

Slide 35 text

実は...

Slide 36

Slide 36 text

ここまでの内容で重要なことを 言い忘れていました

Slide 37

Slide 37 text

それは...

Slide 38

Slide 38 text

ウソをつきました😜

Slide 39

Slide 39 text

どこでウソをついたかわかりましたか?

Slide 40

Slide 40 text

①?

Slide 41

Slide 41 text

②?

Slide 42

Slide 42 text

③?

Slide 43

Slide 43 text

正解は...

Slide 44

Slide 44 text

全部です

Slide 45

Slide 45 text

No content

Slide 46

Slide 46 text

No content

Slide 47

Slide 47 text

正しいリアクションです

Slide 48

Slide 48 text

ということで、(長くなりましたが) 今回のテーマは

Slide 49

Slide 49 text

統計とは? 2020年01月23日

Slide 50

Slide 50 text

No content

Slide 51

Slide 51 text

データにだまされる ~データ利活用に潜む罠~ 2020年01月23日

Slide 52

Slide 52 text

Contents 1. 話す人のこと Who am I 2. 前段の話: ~3つのウソ~ Three lies 3. データは嘘をつかないが、嘘つきはデータを使う Data never lie, but Liars often use data 4. データにだまされないための3つの大切なこと Three important things in Data Analytics

Slide 53

Slide 53 text

データは嘘をつかないが、嘘つきはデータを使う Data never lie, but Liars often use data

Slide 54

Slide 54 text

先ほどの3事例のウソを暴きます

Slide 55

Slide 55 text

①のウソ

Slide 56

Slide 56 text

20代のパスポートの新規取得率は低迷している https://www.mlit.go.jp/common/001270463.pdf

Slide 57

Slide 57 text

20代のパスポートの新規取得率は低迷している https://www.mlit.go.jp/common/001270463.pdf

Slide 58

Slide 58 text

(余談) 解説を書こうとしたら、 別の方が解説してくれていました

Slide 59

Slide 59 text

https://www.landerblue.co.jp/48820/

Slide 60

Slide 60 text

https://www.jijitsu.net/entry/passport-20dai-toukei

Slide 61

Slide 61 text

No content

Slide 62

Slide 62 text

https://www.mofa.go.jp/mofaj/files/000335477.pdf

Slide 63

Slide 63 text

要約: どこが問題だったか? ● 元記事の主張が異なっていた。 ● 計算ミス(を疑う箇所)があった。 ● 上記要因が重なり、インフルエンサーが誤発信してしまった。 ○ 「若者の100人に7人しかパスポートを取得していない」 ● などなど

Slide 64

Slide 64 text

要約: どこが問題だったか? ● 元記事の主張が異なっていた。 ● 計算ミス(を疑う箇所)があった。 ● 上記要因が重なり、インフルエンサーが誤発信してしまった。 ○ 「若者の100人に7人しかパスポートを取得していない」 ● などなど 様々な要因により、データの解釈がずれていく ↓ ウソになる

Slide 65

Slide 65 text

②のウソ

Slide 66

Slide 66 text

尤もらしいデータを見せれば、ロジックを操作できる Q. 転職希望者はやはり年々増えているのか ↓ A. 会員数は増加傾向 A. 転職が決まった人も増加傾向

Slide 67

Slide 67 text

尤もらしいデータを見せれば、ロジックを操作できる Q. 転職希望者はやはり年々増えているのか ↓ A. 会員数は増加傾向 A. 転職が決まった人も増加傾向 ↑ ファクト(≒データ)は正しいが、帰納的に導けていない (あるいは、必要条件を満たしていない)

Slide 68

Slide 68 text

尤もらしいデータを見せれば、ロジックを操作できる Q. 転職希望者はやはり年々増えているのか ↓ A. 会員数は増加傾向 A. 転職が決まった人も増加傾向 ↑ ファクト(≒データ)は正しいが、帰納的に導けていない (あるいは、必要条件を満たしていない) 意図的にロジックを操作することで結論を歪曲する ↓ ウソになる

Slide 69

Slide 69 text

③のウソ

Slide 70

Slide 70 text

X-Tech = 既存のビジネスにテクノロジーを活用する時代 https://www.nikkei.com/article/DGKKZO43151540Q9A330C1EA5000/ 不動産 × IT = RealTech 金融 × IT = FinTech cf. 医療 × IT = HealthCareTech 農業 × IT = AgriTech 広告 × IT = AdTech 教育 × IT = EdTech マーケティング × IT = MarTech

Slide 71

Slide 71 text

X-Tech = 既存のビジネスにテクノロジーを活用する時代 https://www.nikkei.com/article/DGKKZO43151540Q9A330C1EA5000/ 不動産 × IT = RealTech 金融 × IT = FinTech cf. 医療 × IT = HealthCareTech 農業 × IT = AgriTech 広告 × IT = AdTech 教育 × IT = EdTech マーケティング × IT = MarTech

Slide 72

Slide 72 text

倍率の罠

Slide 73

Slide 73 text

倍率の罠 結論ありきで統計データを捏造する ↓ ウソになる

Slide 74

Slide 74 text

Summary データは嘘をつかないが、嘘つきはデータを使う ● データの解釈を誤ると、間違った情報となる。 …① ● 正しいデータでも、人を騙そうと思えば容易にできる。 …② ● データを捏造すると、簡単に人を騙せる。 …③

Slide 75

Slide 75 text

さて、

Slide 76

Slide 76 text

ここからが大事

Slide 77

Slide 77 text

データにだまされないための3つの大切なこと Three important things in Data Analytics

Slide 78

Slide 78 text

「3つの大切なこと」と言いましたが...

Slide 79

Slide 79 text

本当は10この要素について述べたい

Slide 80

Slide 80 text

誰かの解説を見聞するよりも、是非読んでほしい本 https://www.amazon.co.jp/dp/4822289605

Slide 81

Slide 81 text

可能ならば原典を読むのをオススメします😉 https://www.amazon.com/dp/1250107814

Slide 82

Slide 82 text

データにだまされないための3つの大切なこと 疑う Doubt and think everything 調べ、理解する Investigate and understand anything 武器(あるいは防具)を鍛える Train your technical skills and imagination

Slide 83

Slide 83 text

疑う Doubt and think everything

Slide 84

Slide 84 text

疑う ≠ 信用しない

Slide 85

Slide 85 text

疑う ≠ 信用しない

Slide 86

Slide 86 text

疑う = 視点を変える、別の視点を追加する Beautiful Girl? Old Woman?

Slide 87

Slide 87 text

疑うターゲット データ データを加工したプロセス

Slide 88

Slide 88 text

Point: 思考停止しない 以下の思考に陥るとだまされやすい(し、簡単に人をだますことができる) ● マスメディアが言っていたから正しい ● えらい人、有名人が言っていたから正しい ● インターネットの情報は正しい ● 政府のデータだから正しい ● 統計的手法を使ったから正しい

Slide 89

Slide 89 text

疑うことからスタートしてみよう

Slide 90

Slide 90 text

調べ、理解する Investigate and understand anything

Slide 91

Slide 91 text

Point: エビデンス(証拠) 統計データでいうエビデンス ● データ: データソース ● データを加工したプロセス ○ 統計的アプローチ ○ 統計モデル ○ など ● 前提条件 ○ 調査環境 ○ 制約 ○ など

Slide 92

Slide 92 text

エビデンスの調べ方 ● 公式データ ● ggる ● 複数の情報源 ● 論文、記事内にある参照先

Slide 93

Slide 93 text

エビデンスを理解する ● 何を示しているのか? ● 論拠の内容に整合性があるか? ● 仮説はあるか? ○ ある場合は、仮説の設定は妥当か? ● 前提条件に過不足はあるか? ● エビデンス自体の正しさは最初は気にしない ○ 正しいかどうか、の判断は主観が入りやすいので気を付ける。 ○ エビデンス自体が間違っている場合は、上記が破綻しているケースが多い。

Slide 94

Slide 94 text

データの大海に飛び込むのを恐れない

Slide 95

Slide 95 text

その経験と知識は確実にあなたの血肉になります

Slide 96

Slide 96 text

医師の武器防具: 医療技術、医療知識、etc... 弁護士の武器防具: 法律知識、交渉術、etc... 消防士の武器防具: 肉体、防火知識、etc... 武器(あるいは防具)を鍛える

Slide 97

Slide 97 text

医師の武器防具: 医療技術、医療知識、etc... 弁護士の武器防具: 法律知識、交渉術、etc... 消防士の武器防具: 肉体、防火知識、etc... 武器(あるいは防具)を鍛える

Slide 98

Slide 98 text

データアナリストの武器防具: 説得力 = 数学、統計学 伝達力 = ロジカルシンキング、クリティカルシンキング 知恵 = ドメイン知識、業界知識、リベラルアーツ 武器(あるいは防具)を鍛える

Slide 99

Slide 99 text

データアナリストの武器防具: 説得力 = 数学、統計学 伝達力 = ロジカルシンキング、クリティカルシンキング 知恵 = ドメイン知識、業界知識、リベラルアーツ 武器(あるいは防具)を鍛える

Slide 100

Slide 100 text

武器防具を有効活用しよう

Slide 101

Slide 101 text

アップデートも忘れないように

Slide 102

Slide 102 text

アップデートも忘れないように

Slide 103

Slide 103 text

アップデートも忘れないように

Slide 104

Slide 104 text

アップデートも忘れないように

Slide 105

Slide 105 text

Conclusion データにだまされないための3つの大切なこと ● 疑う: 視点を変えて別の角度から事象を見る ● 調べ、理解する: データソースを突き止め、何を示しているのかを把握する ● 武器(あるいは防具)を鍛える: 知識、技術を用いて、より正しい道を導く 間違った情報に惑わされない知恵を持つ

Slide 106

Slide 106 text

No content