Slide 1

Slide 1 text

分析案件をやり始めたときに 陥っていたことの共有と対策 ⻑野 克也 (@chitose_ng)

Slide 2

Slide 2 text

後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%

Slide 3

Slide 3 text

DataGatewayをくぐり始めた⼈ DataGatewayをくぐろうとする部下がいる⼈ Target □□□□□□□□□□ 1/100%

Slide 4

Slide 4 text

Company TVISION INSIGHTS株式会社 Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ Other チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール □□□□□□□□□□ 2/100%

Slide 5

Slide 5 text

Company TVISION INSIGHTS株式会社 業界的に新領域のデータを 提供する会社 ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ プロフィール NO PRESENTATION ?/100%

Slide 6

Slide 6 text

モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、 視聴態度データを取得 NO PRESENTATION ?/100%

Slide 7

Slide 7 text

⾃動で顔認識・識別 どう観ているのか (視聴体制) 誰が観ているのか (個⼈特定) テレビの注視度を 計測する NO PRESENTATION ?/100%

Slide 8

Slide 8 text

業界的に、今までは「テレビがついているか」のデータから KPIへの影響を⾒ていた NO PRESENTATION ?/100%

Slide 9

Slide 9 text

「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる NO PRESENTATION ?/100%

Slide 10

Slide 10 text

「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる 業界的に未解明の部分が多いので、 どう使えるかのR&Dと クライアントのKPIとの関係を調査/分析 仕事内容 NO PRESENTATION ?/100%

Slide 11

Slide 11 text

2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト) R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ෇͖ʗ 経歴 □□□□□□□□□□ 6/100%

Slide 12

Slide 12 text

分析案件をやり始めたときに よくあった会話

Slide 13

Slide 13 text

こんな感じのモデル考えてます! ○○という手法もあると思うけど なんでこの手法なの? な、なんとなくっす。。。 本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢ ʗ ■□□□□□□□□□ 10/100%

Slide 14

Slide 14 text

こんな感じのモデル考えてます! このモデル式だと☓☓に△△って仮定を 置いてるってことだよね? あっ、はい多分そうっす。 (言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ ͢ ʗ ■□□□□□□□□□ 12/100%

Slide 15

Slide 15 text

何故なんとなく分析をしてしまうのか︖ Topic

Slide 16

Slide 16 text

何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない ■□□□□□□□□□ 16/100%

Slide 17

Slide 17 text

1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない ■■□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか

Slide 18

Slide 18 text

1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない テキトーにそれっぽい⼿法を選ぶ理由 テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ■■□□□□□□□□ 26/100% 何故なんとなく分析をしてしまうのか

Slide 19

Slide 19 text

1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーにそれっぽい⼿法を選ぶ理由 ■■■□□□□□□□ 35/100% 何故なんとなく分析をしてしまうのか

Slide 20

Slide 20 text

テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする ■■■□□□□□□□ 37/100%

Slide 21

Slide 21 text

テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ ■■■■□□□□□□ 40/100%

Slide 22

Slide 22 text

テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ ■■■■□□□□□□ 42/100%

Slide 23

Slide 23 text

テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ ■■■■□□□□□□ 45/100%

Slide 24

Slide 24 text

テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ 類似⼿法との⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習

Slide 25

Slide 25 text

Random Forestと Gradient Boosting Decision Treeの違いを ⾔えますか︖ Example ■■■■■□□□□□ 50/100%

Slide 26

Slide 26 text

何故モデルをなんとなく作るか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ■■■■■□□□□□ 57/100%

Slide 27

Slide 27 text

選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 60/100%

Slide 28

Slide 28 text

説明ができない部分は、 考えていない部分 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 62/100%

Slide 29

Slide 29 text

説明ができない部分は、 考えていない部分 この思考を繰り返すと、 考えて要素を⼊れられるようになる 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 67/100%

Slide 30

Slide 30 text

次のモデルへの問いは何か Example ■■■■■■■□□□ 70/100%

Slide 31

Slide 31 text

CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example ■■■■■■■□□□ 72/100%

Slide 32

Slide 32 text

Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■□□□ 74/100% どういう仮定を置いたモデル式なのか

Slide 33

Slide 33 text

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■□□□ 78/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布

Slide 34

Slide 34 text

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 82/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布 CM種類が別でも 効果が同じ

Slide 35

Slide 35 text

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 83/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ

Slide 36

Slide 36 text

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 87/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖

Slide 37

Slide 37 text

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖ 何を問えばいいのかは慣れが必要。 はじめは上司に⼿伝ってもらおう。

Slide 38

Slide 38 text

今⽇のまとめ Today’s Summary ■■■■■■■■■□ 94/100%

Slide 39

Slide 39 text

⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ■■■■■■■■■□ 95/100%

Slide 40

Slide 40 text

■■■■■■■■■■ 100/100%