分析案件をやり始めたときに、自分の頭でちゃんと考えて分析ができていなかったのでどうやって対策したか
分析案件をやり始めたときに陥っていたことの共有と対策⻑野 克也 (@chitose_ng)
View Slide
後⽇、スライドのアップロードをします。Caution□□□□□□□□□□ 0/100%
DataGatewayをくぐり始めた⼈DataGatewayをくぐろうとする部下がいる⼈Target□□□□□□□□□□ 1/100%
Company TVISION INSIGHTS株式会社Work- テレビの視聴態度のR&D- クライアントKPIとの関係性調査ʘςϨϏͷࢹௌଶΛଌΔձࣾʗOtherチトセナガノ(@chitose_ng)まずは蝋の翼からTableauデータ分析 ~実践から活⽤まで~プロフィール□□□□□□□□□□ 2/100%
Company TVISION INSIGHTS株式会社業界的に新領域のデータを提供する会社ʘςϨϏͷࢹௌଶΛଌΔձࣾʗプロフィールNO PRESENTATION ?/100%
モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、視聴態度データを取得NO PRESENTATION ?/100%
⾃動で顔認識・識別どう観ているのか(視聴体制)誰が観ているのか(個⼈特定)テレビの注視度を計測するNO PRESENTATION ?/100%
業界的に、今までは「テレビがついているか」のデータからKPIへの影響を⾒ていたNO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータからKPIへの影響を⾒ることができるNO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータからKPIへの影響を⾒ることができる業界的に未解明の部分が多いので、どう使えるかのR&DとクライアントのKPIとの関係を調査/分析仕事内容NO PRESENTATION ?/100%
201504201709201901 TodaySQLおじさん(データ抽出の⼈/データアーキテクト)R&Dクライアント分析2年半1年半BI屋10ヶ⽉ʘίίͷؾ͖ʗ経歴□□□□□□□□□□ 6/100%
分析案件をやり始めたときによくあった会話
こんな感じのモデル考えてます!○○という手法もあると思うけどなんでこの手法なの?な、なんとなくっす。。。本当にあったアレな会話1ʘ্࢘Ͱ͢ʗ■□□□□□□□□□ 10/100%
こんな感じのモデル考えてます!このモデル式だと☓☓に△△って仮定を置いてるってことだよね?あっ、はい多分そうっす。(言われるまで意識してなかったけど)本当にあったアレな会話2ʘ্࢘Ͱ͢ʗ■□□□□□□□□□ 12/100%
何故なんとなく分析をしてしまうのか︖Topic
何故なんとなく分析をしてしまうのか1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない■□□□□□□□□□ 16/100%
1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていない■■□□□□□□□□ 20/100%何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないテキトーにそれっぽい⼿法を選ぶ理由テキトーに選んだ⼿法で、テキトーに要素を⽳埋めする理由■■□□□□□□□□ 26/100%何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないどうやって防ぐかテキトーにそれっぽい⼿法を選ぶ理由■■■□□□□□□□ 35/100%何故なんとなく分析をしてしまうのか
テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする■■■□□□□□□□ 37/100%
テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする何のために存在する⼿法︖■■■■□□□□□□ 40/100%
テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖■■■■□□□□□□ 42/100%
テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖類似⼿法との違いは、何故うまれたの︖■■■■□□□□□□ 45/100%
テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする何のために存在する⼿法︖類似⼿法との⽐較した、メリット・デメリットは︖類似⼿法との違いは、何故うまれたの︖要するに、論⽂のような読み⽅で理解・学習
Random ForestとGradient Boosting Decision Treeの違いを⾔えますか︖Example■■■■■□□□□□ 50/100%
何故モデルをなんとなく作るか1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないどうやって防ぐかテキトーに選んだ⼿法で、テキトーに要素を⽳埋めする理由■■■■■□□□□□ 57/100%
選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか■■■■■■□□□□ 60/100%
説明ができない部分は、考えていない部分選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか■■■■■■□□□□ 62/100%
説明ができない部分は、考えていない部分この思考を繰り返すと、考えて要素を⼊れられるようになる選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか■■■■■■□□□□ 67/100%
次のモデルへの問いは何かExample■■■■■■■□□□ 70/100%
CM認知度 = α CM本数 + β CM種類ダミー + 定数Example■■■■■■■□□□ 72/100%
ExampleOLSで解くので正規分布CM認知度 = α CM本数 + β CM種類ダミー + 定数■■■■■■■□□□ 74/100%どういう仮定を置いたモデル式なのか
ExampleCM認知度 = α CM本数 + β CM種類ダミー + 定数■■■■■■■□□□ 78/100%どういう仮定を置いたモデル式なのか値が線形増加するOLSで解くので正規分布
ExampleCM認知度 = α CM本数 + β CM種類ダミー + 定数■■■■■■■■□□ 82/100%どういう仮定を置いたモデル式なのか値が線形増加するOLSで解くので正規分布CM種類が別でも効果が同じ
ExampleCM認知度 = α CM本数 + β CM種類ダミー + 定数■■■■■■■■□□ 83/100%値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖OLSで解くので正規分布CM種類が別でも効果が同じ
ExampleCM認知度 = α CM本数 + β CM種類ダミー + 定数■■■■■■■■□□ 87/100%値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖OLSで解くので正規分布CM種類が別でも効果が同じCM種類で効果が違うのでは︖
ExampleCM認知度 = α CM本数 + β CM種類ダミー + 定数値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖OLSで解くので正規分布CM種類が別でも効果が同じCM種類で効果が違うのでは︖何を問えばいいのかは慣れが必要。はじめは上司に⼿伝ってもらおう。
今⽇のまとめToday’s Summary■■■■■■■■■□ 94/100%
⾃分の頭でちゃんと考えた分析をするためにはToday’s Summary1 ⼿法の違いを意識して学習し、2 何について考えればいいのか把握し思考することで、3 ⾃分が考えたあらゆる選択に対して、説明可能にする。■■■■■■■■■□ 95/100%
■■■■■■■■■■ 100/100%