Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano
by
knagano
×
Copy
Open
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Slide 1
Slide 1 text
分析案件をやり始めたときに 陥っていたことの共有と対策 ⻑野 克也 (@chitose_ng)
Slide 2
Slide 2 text
後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%
Slide 3
Slide 3 text
DataGatewayをくぐり始めた⼈ DataGatewayをくぐろうとする部下がいる⼈ Target □□□□□□□□□□ 1/100%
Slide 4
Slide 4 text
Company TVISION INSIGHTS株式会社 Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ Other チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール □□□□□□□□□□ 2/100%
Slide 5
Slide 5 text
Company TVISION INSIGHTS株式会社 業界的に新領域のデータを 提供する会社 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ プロフィール NO PRESENTATION ?/100%
Slide 6
Slide 6 text
モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、 視聴態度データを取得 NO PRESENTATION ?/100%
Slide 7
Slide 7 text
⾃動で顔認識・識別 どう観ているのか (視聴体制) 誰が観ているのか (個⼈特定) テレビの注視度を 計測する NO PRESENTATION ?/100%
Slide 8
Slide 8 text
業界的に、今までは「テレビがついているか」のデータから KPIへの影響を⾒ていた NO PRESENTATION ?/100%
Slide 9
Slide 9 text
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる NO PRESENTATION ?/100%
Slide 10
Slide 10 text
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる 業界的に未解明の部分が多いので、 どう使えるかのR&Dと クライアントのKPIとの関係を調査/分析 仕事内容 NO PRESENTATION ?/100%
Slide 11
Slide 11 text
2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト) R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ͖ʗ 経歴 □□□□□□□□□□ 6/100%
Slide 12
Slide 12 text
分析案件をやり始めたときに よくあった会話
Slide 13
Slide 13 text
こんな感じのモデル考えてます! ○○という手法もあると思うけど なんでこの手法なの? な、なんとなくっす。。。 本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢ ʗ ■□□□□□□□□□ 10/100%
Slide 14
Slide 14 text
こんな感じのモデル考えてます! このモデル式だと☓☓に△△って仮定を 置いてるってことだよね? あっ、はい多分そうっす。 (言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ ͢ ʗ ■□□□□□□□□□ 12/100%
Slide 15
Slide 15 text
何故なんとなく分析をしてしまうのか︖ Topic
Slide 16
Slide 16 text
何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない ■□□□□□□□□□ 16/100%
Slide 17
Slide 17 text
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない ■■□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか
Slide 18
Slide 18 text
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない テキトーにそれっぽい⼿法を選ぶ理由 テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ■■□□□□□□□□ 26/100% 何故なんとなく分析をしてしまうのか
Slide 19
Slide 19 text
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーにそれっぽい⼿法を選ぶ理由 ■■■□□□□□□□ 35/100% 何故なんとなく分析をしてしまうのか
Slide 20
Slide 20 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする ■■■□□□□□□□ 37/100%
Slide 21
Slide 21 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ ■■■■□□□□□□ 40/100%
Slide 22
Slide 22 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ ■■■■□□□□□□ 42/100%
Slide 23
Slide 23 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ ■■■■□□□□□□ 45/100%
Slide 24
Slide 24 text
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ 類似⼿法との⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習
Slide 25
Slide 25 text
Random Forestと Gradient Boosting Decision Treeの違いを ⾔えますか︖ Example ■■■■■□□□□□ 50/100%
Slide 26
Slide 26 text
何故モデルをなんとなく作るか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ■■■■■□□□□□ 57/100%
Slide 27
Slide 27 text
選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 60/100%
Slide 28
Slide 28 text
説明ができない部分は、 考えていない部分 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 62/100%
Slide 29
Slide 29 text
説明ができない部分は、 考えていない部分 この思考を繰り返すと、 考えて要素を⼊れられるようになる 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ■■■■■■□□□□ 67/100%
Slide 30
Slide 30 text
次のモデルへの問いは何か Example ■■■■■■■□□□ 70/100%
Slide 31
Slide 31 text
CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example ■■■■■■■□□□ 72/100%
Slide 32
Slide 32 text
Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■□□□ 74/100% どういう仮定を置いたモデル式なのか
Slide 33
Slide 33 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■□□□ 78/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布
Slide 34
Slide 34 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 82/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布 CM種類が別でも 効果が同じ
Slide 35
Slide 35 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 83/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ
Slide 36
Slide 36 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 ■■■■■■■■□□ 87/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖
Slide 37
Slide 37 text
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖ 何を問えばいいのかは慣れが必要。 はじめは上司に⼿伝ってもらおう。
Slide 38
Slide 38 text
今⽇のまとめ Today’s Summary ■■■■■■■■■□ 94/100%
Slide 39
Slide 39 text
⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ■■■■■■■■■□ 95/100%
Slide 40
Slide 40 text
■■■■■■■■■■ 100/100%