Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano
by
knagano
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
分析案件をやり始めたときに 陥っていたことの共有と対策 ⻑野 克也 (@chitose_ng)
Slide 2
Slide 2 text
後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%
Slide 3
Slide 3 text
DataGatewayをくぐり始めた⼈ DataGatewayをくぐろうとする部下がいる⼈ Target □□□□□□□□□□ 1/100%
Slide 4
Slide 4 text
Company TVISION INSIGHTS株式会社 Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ Other チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール □□□□□□□□□□ 2/100%
Slide 5
Slide 5 text
Company TVISION INSIGHTS株式会社 業界的に新領域のデータを 提供する会社 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ プロフィール NO PRESENTATION ?/100%
Slide 6
Slide 6 text
モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、 視聴態度データを取得 NO PRESENTATION ?/100%
Slide 7
Slide 7 text
⾃動で顔認識・識別 どう観ているのか (視聴体制) 誰が観ているのか (個⼈特定) テレビの注視度を 計測する NO PRESENTATION ?/100%
Slide 8
Slide 8 text
業界的に、今までは「テレビがついているか」のデータから KPIへの影響を⾒ていた NO PRESENTATION ?/100%
Slide 9
Slide 9 text
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる NO PRESENTATION ?/100%
Slide 10
Slide 10 text
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる 業界的に未解明の部分が多いので、 どう使えるかのR&Dと クライアントのKPIとの関係を調査/分析 仕事内容 NO PRESENTATION ?/100%
Slide 11
Slide 11 text
2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト) R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ͖ʗ 経歴 □□□□□□□□□□ 6/100%
Slide 12
Slide 12 text
分析案件をやり始めたときに よくあった会話
Slide 13
Slide 13 text
こんな感じのモデル考えてます! ○○という手法もあると思うけど なんでこの手法なの? な、なんとなくっす。。。 本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢ ʗ ■□□□□□□□□□ 10/100%
Slide 14
Slide 14 text
こんな感じのモデル考えてます! このモデル式だと☓☓に△△って仮定を 置いてるってことだよね? あっ、はい多分そうっす。 (言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ ͢ ʗ ■□□□□□□□□□ 12/100%
Slide 15
Slide 15 text
何故なんとなく分析をしてしまうのか︖ Topic
Slide 16
Slide 16 text
何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない ■□□□□□□□□□ 16/100%
Slide 17
Slide 17 text
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない ■■□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか
Slide 18
Slide 18 text
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない テキトーにそれっぽい⼿法を選ぶ理由 テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ■■□□□□□□□□ 26/100% 何故なんとなく分析をしてしまうのか
Slide 19
Slide 19 text
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーにそれっぽい⼿法を選ぶ理由 ■■■□□□□□□□ 35/100% 何故なんとなく分析をしてしまうのか
Slide 20
Slide 20 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする ■■■□□□□□□□ 37/100%
Slide 21
Slide 21 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ ■■■■□□□□□□ 40/100%
Slide 22
Slide 22 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ ■■■■□□□□□□ 42/100%
Slide 23
Slide 23 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ ■■■■□□□□□□ 45/100%
Slide 24
Slide 24 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ 類似⼿法との⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習
Slide 25
Slide 25 text
Random Forestと Gradient Boosting Decision Treeの違いを ⾔えますか︖ Example ■■■■■□□□□□ 50/100%
Slide 26
Slide 26 text
何故モデルをなんとなく作るか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ■■■■■□□□□□ 57/100%
Slide 27
Slide 27 text
選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 60/100%
Slide 28
Slide 28 text
説明ができない部分は、 考えていない部分 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 62/100%
Slide 29
Slide 29 text
説明ができない部分は、 考えていない部分 この思考を繰り返すと、 考えて要素を⼊れられるようになる 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 67/100%
Slide 30
Slide 30 text
次のモデルへの問いは何か Example ■■■■■■■□□□ 70/100%
Slide 31
Slide 31 text
CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example ■■■■■■■□□□ 72/100%
Slide 32
Slide 32 text
Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■□□□ 74/100% どういう仮定を置いたモデル式なのか
Slide 33
Slide 33 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■□□□ 78/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布
Slide 34
Slide 34 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 82/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布 CM種類が別でも 効果が同じ
Slide 35
Slide 35 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 83/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ
Slide 36
Slide 36 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 87/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖
Slide 37
Slide 37 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖ 何を問えばいいのかは慣れが必要。 はじめは上司に⼿伝ってもらおう。
Slide 38
Slide 38 text
今⽇のまとめ Today’s Summary ■■■■■■■■■□ 94/100%
Slide 39
Slide 39 text
⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ■■■■■■■■■□ 95/100%
Slide 40
Slide 40 text
■■■■■■■■■■ 100/100%