Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Gateway Talk vol.4 分析案件をやり始めたときに 陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano

knagano
November 21, 2019

Data Gateway Talk vol.4 分析案件をやり始めたときに 陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano

分析案件をやり始めたときに、自分の頭でちゃんと考えて分析ができていなかったのでどうやって対策したか

knagano

November 21, 2019
Tweet

More Decks by knagano

Other Decks in Business

Transcript

  1. 分析案件をやり始めたときに
    陥っていたことの共有と対策
    ⻑野 克也 (@chitose_ng)

    View Slide

  2. 後⽇、スライドのアップロードをします。
    Caution
    □□□□□□□□□□ 0/100%

    View Slide

  3. DataGatewayをくぐり始めた⼈
    DataGatewayをくぐろうとする部下がいる⼈
    Target
    □□□□□□□□□□ 1/100%

    View Slide

  4. Company TVISION INSIGHTS株式会社
    Work
    - テレビの視聴態度のR&D
    - クライアントKPIとの関係性調査
    ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ
    Other
    チトセナガノ(@chitose_ng)
    まずは蝋の翼から
    Tableauデータ分析 ~実践から活⽤まで~
    プロフィール
    □□□□□□□□□□ 2/100%

    View Slide

  5. Company TVISION INSIGHTS株式会社
    業界的に新領域のデータを
    提供する会社
    ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ
    プロフィール
    NO PRESENTATION ?/100%

    View Slide

  6. モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、
    視聴態度データを取得
    NO PRESENTATION ?/100%

    View Slide

  7. ⾃動で顔認識・識別
    どう観ているのか
    (視聴体制)
    誰が観ているのか
    (個⼈特定)
    テレビの注視度を
    計測する
    NO PRESENTATION ?/100%

    View Slide

  8. 業界的に、今までは「テレビがついているか」のデータから
    KPIへの影響を⾒ていた
    NO PRESENTATION ?/100%

    View Slide

  9. 「テレビをどう観ているか」という解像度がより上がったデータから
    KPIへの影響を⾒ることができる
    NO PRESENTATION ?/100%

    View Slide

  10. 「テレビをどう観ているか」という解像度がより上がったデータから
    KPIへの影響を⾒ることができる
    業界的に未解明の部分が多いので、
    どう使えるかのR&Dと
    クライアントのKPIとの関係を調査/分析
    仕事内容
    NO PRESENTATION ?/100%

    View Slide

  11. 2015
    04
    2017
    09
    2019
    01 Today
    SQLおじさん
    (データ抽出の⼈/
    データアーキテクト)
    R&D
    クライアント分析
    2年半
    1年半
    BI屋
    10ヶ⽉
    ʘίίͷؾ෇͖ʗ
    経歴
    □□□□□□□□□□ 6/100%

    View Slide

  12. 分析案件をやり始めたときに
    よくあった会話

    View Slide

  13. こんな感じのモデル考えてます!
    ○○という手法もあると思うけど
    なんでこの手法なの?
    な、なんとなくっす。。。
    本当にあったアレな会話1
    ʘ


    Ͱ
    ͢
    ʗ
    ■□□□□□□□□□ 10/100%

    View Slide

  14. こんな感じのモデル考えてます!
    このモデル式だと☓☓に△△って仮定を
    置いてるってことだよね?
    あっ、はい多分そうっす。
    (言われるまで意識してなかったけど)
    本当にあったアレな会話2
    ʘ


    Ͱ
    ͢
    ʗ
    ■□□□□□□□□□ 12/100%

    View Slide

  15. 何故なんとなく分析をしてしまうのか︖
    Topic

    View Slide

  16. 何故なんとなく分析をしてしまうのか
    1 モデルの構築⼿法を
    どうやって選んだらいいのかわかっていない
    ■□□□□□□□□□ 16/100%

    View Slide

  17. 1 モデルの構築⼿法を
    どうやって選んだらいいのかわかっていない
    2 モデルの構築⼿法を選んだあとに
    何について考えればいいのかわかっていない
    ■■□□□□□□□□ 20/100%
    何故なんとなく分析をしてしまうのか

    View Slide

  18. 1 モデルの構築⼿法を
    どうやって選んだらいいのかわかっていない
    2 モデルの構築⼿法を選んだあとに
    何について考えればいいのかわかっていない
    テキトーにそれっぽい⼿法を選ぶ理由
    テキトーに選んだ⼿法で、
    テキトーに要素を⽳埋めする理由
    ■■□□□□□□□□ 26/100%
    何故なんとなく分析をしてしまうのか

    View Slide

  19. 1 モデルの構築⼿法を
    どうやって選んだらいいのかわかっていない
    2 モデルの構築⼿法を選んだあとに
    何について考えればいいのかわかっていない
    どうやって防ぐか
    テキトーにそれっぽい⼿法を選ぶ理由
    ■■■□□□□□□□ 35/100%
    何故なんとなく分析をしてしまうのか

    View Slide

  20. テキトーにそれっぽい⼿法を選ぶの
    をどう防ぐか
    何故その⼿法が必要なのかを考えた学習をする
    ■■■□□□□□□□ 37/100%

    View Slide

  21. テキトーにそれっぽい⼿法を選ぶの
    をどう防ぐか
    何故その⼿法が必要なのかを考えた学習をする
    何のために存在する⼿法︖
    ■■■■□□□□□□ 40/100%

    View Slide

  22. テキトーにそれっぽい⼿法を選ぶの
    をどう防ぐか
    何故その⼿法が必要なのかを考えた学習をする
    類似⼿法と⽐較した、
    メリット・デメリットは︖
    ■■■■□□□□□□ 42/100%

    View Slide

  23. テキトーにそれっぽい⼿法を選ぶの
    をどう防ぐか
    何故その⼿法が必要なのかを考えた学習をする
    類似⼿法と⽐較した、
    メリット・デメリットは︖
    類似⼿法との違いは、
    何故うまれたの︖
    ■■■■□□□□□□ 45/100%

    View Slide

  24. テキトーにそれっぽい⼿法を選ぶの
    をどう防ぐか
    何故その⼿法が必要なのかを考えた学習をする
    何のために存在する⼿法︖
    類似⼿法との⽐較した、
    メリット・デメリットは︖
    類似⼿法との違いは、
    何故うまれたの︖
    要するに、論⽂のような読み⽅で理解・学習

    View Slide

  25. Random Forestと
    Gradient Boosting Decision Treeの違いを
    ⾔えますか︖
    Example
    ■■■■■□□□□□ 50/100%

    View Slide

  26. 何故モデルをなんとなく作るか
    1 モデルの構築⼿法を
    どうやって選んだらいいのかわかっていない
    2 モデルの構築⼿法を選んだあとに
    何について考えればいいのかわかっていない
    どうやって防ぐか
    テキトーに選んだ⼿法で、
    テキトーに要素を⽳埋めする理由
    ■■■■■□□□□□ 57/100%

    View Slide

  27. 選んだ要素ひとつひとつに問いを⽴て、
    何故選んだのか説明可能な状態にする
    テキトーに要素を
    ⽳埋めするのをどう防ぐか
    ■■■■■■□□□□ 60/100%

    View Slide

  28. 説明ができない部分は、
    考えていない部分
    選んだ要素ひとつひとつに問いを⽴て、
    何故選んだのか説明可能な状態にする
    テキトーに要素を
    ⽳埋めするのをどう防ぐか
    ■■■■■■□□□□ 62/100%

    View Slide

  29. 説明ができない部分は、
    考えていない部分
    この思考を繰り返すと、
    考えて要素を⼊れられるようになる
    選んだ要素ひとつひとつに問いを⽴て、
    何故選んだのか説明可能な状態にする
    テキトーに要素を
    ⽳埋めするのをどう防ぐか
    ■■■■■■□□□□ 67/100%

    View Slide

  30. 次のモデルへの問いは何か
    Example
    ■■■■■■■□□□ 70/100%

    View Slide

  31. CM認知度 = α CM本数 + β CM種類ダミー + 定数
    Example
    ■■■■■■■□□□ 72/100%

    View Slide

  32. Example
    OLSで解くので正規分布
    CM認知度 = α CM本数 + β CM種類ダミー + 定数
    ■■■■■■■□□□ 74/100%
    どういう仮定を置いたモデル式なのか

    View Slide

  33. Example
    CM認知度 = α CM本数 + β CM種類ダミー + 定数
    ■■■■■■■□□□ 78/100%
    どういう仮定を置いたモデル式なのか
    値が線形増加する
    OLSで解くので正規分布

    View Slide

  34. Example
    CM認知度 = α CM本数 + β CM種類ダミー + 定数
    ■■■■■■■■□□ 82/100%
    どういう仮定を置いたモデル式なのか
    値が線形増加する
    OLSで解くので正規分布
    CM種類が別でも
    効果が同じ

    View Slide

  35. Example
    CM認知度 = α CM本数 + β CM種類ダミー + 定数
    ■■■■■■■■□□ 83/100%
    値が線形増加する
    どういう仮定を置いたモデル式なのか
    途中で飽和するから
    対数化が必要では︖
    OLSで解くので正規分布
    CM種類が別でも
    効果が同じ

    View Slide

  36. Example
    CM認知度 = α CM本数 + β CM種類ダミー + 定数
    ■■■■■■■■□□ 87/100%
    値が線形増加する
    どういう仮定を置いたモデル式なのか
    途中で飽和するから
    対数化が必要では︖
    OLSで解くので正規分布
    CM種類が別でも
    効果が同じ
    CM種類で
    効果が違うのでは︖

    View Slide

  37. Example
    CM認知度 = α CM本数 + β CM種類ダミー + 定数
    値が線形増加する
    どういう仮定を置いたモデル式なのか
    途中で飽和するから
    対数化が必要では︖
    OLSで解くので正規分布
    CM種類が別でも
    効果が同じ
    CM種類で
    効果が違うのでは︖
    何を問えばいいのかは慣れが必要。
    はじめは上司に⼿伝ってもらおう。

    View Slide

  38. 今⽇のまとめ
    Today’s Summary
    ■■■■■■■■■□ 94/100%

    View Slide

  39. ⾃分の頭でちゃんと考えた分析をするためには
    Today’s Summary
    1 ⼿法の違いを意識して学習し、
    2 何について考えればいいのか把握し思考することで、
    3 ⾃分が考えたあらゆる選択に対して、説明可能にする。
    ■■■■■■■■■□ 95/100%

    View Slide

  40. ■■■■■■■■■■ 100/100%

    View Slide