分析案件をやり始めたときに陥っていたことの共有と対策 / DS project for beginner

分析案件をやり始めたときに陥っていたことの共有と対策ちとせちゃん (@chitose_ng_vrc)

後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%

このスライドは19年11⽉に作成した内容の固有名詞の⼀部を修正しただけなので当時のちとせ観点でのお話です Caution □□□□□□□□□□ 0/100%

Company Revisio株式会社 (旧TVISION INSIGHTS株式会社) Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ
Other DS⽤アカウント→チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール NO PRESENTATION ?/100%

2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト)
R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ෇͖ʗ 経歴 □□□□□□□□□□ 6/100%

分析案件をやり始めたときによくあった会話

こんな感じのモデル考えてます！ ◦◦という手法もあると思うけどなんでこの手法なの？な、なんとなくっす。。。本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢
ʗ ▪□□□□□□□□□ 10/100%

こんな感じのモデル考えてます！このモデル式だと☓☓に△△って仮定を置いてるってことだよね？あっ、はい多分そうっす。（言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ
͢ ʗ ▪□□□□□□□□□ 12/100%

何故なんとなく分析をしてしまうのか︖ Topic

何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない ▪□□□□□□□□□ 16/100%

1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていない ▪▪□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか

1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないテキトーにそれっぽい⼿法を選ぶ理由テキトーに選んだ⼿法で、テキトーに要素を⽳埋めする理由 ▪▪□□□□□□□□
26/100% 何故なんとなく分析をしてしまうのか

1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないどうやって防ぐかテキトーにそれっぽい⼿法を選ぶ理由 ▪▪▪□□□□□□□ 35/100%
何故なんとなく分析をしてしまうのか

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする ▪▪▪□□□□□□□ 37/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする何のために存在する⼿法︖ ▪▪▪▪□□□□□□ 40/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖ ▪▪▪▪□□□□□□ 42/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖ 類似⼿法との違いは、何故うまれたの︖ ▪▪▪▪□□□□□□ 45/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする何のために存在する⼿法︖ 類似⼿法との⽐較した、メリット・デメリットは︖ 類似⼿法との違いは、何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習

Random Forestと Gradient Boosting Decision Treeの違いを⾔えますか︖ Example ▪▪▪▪▪□□□□□ 50/100%

何故モデルをなんとなく作るか 1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないどうやって防ぐかテキトーに選んだ⼿法で、テキトーに要素を⽳埋めする理由
▪▪▪▪▪□□□□□ 57/100%

選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 60/100%

説明ができない部分は、考えていない部分選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 62/100%

説明ができない部分は、考えていない部分この思考を繰り返すと、考えて要素を⼊れられるようになる選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 67/100%

次のモデルへの問いは何か Example ▪▪▪▪▪▪▪□□□ 70/100%

CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example
▪▪▪▪▪▪▪□□□ 72/100%

Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー +
定数 ▪▪▪▪▪▪▪□□□ 74/100% どういう仮定を置いたモデル式なのか

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪□□□ 78/100% どういう仮定を置いたモデル式なのか値が線形増加する OLSで解くので正規分布

▪▪▪▪▪▪▪▪□□ 82/100% どういう仮定を置いたモデル式なのか値が線形増加する OLSで解くので正規分布 CM種類が別でも効果が同じ

▪▪▪▪▪▪▪▪□□ 83/100% 値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも効果が同じ

▪▪▪▪▪▪▪▪□□ 87/100% 値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも効果が同じ CM種類で効果が違うのでは︖

値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも効果が同じ CM種類で効果が違うのでは︖ 何を問えばいいのかは慣れが必要。はじめは上司に⼿伝ってもらおう。

今⽇のまとめ Today’s Summary ▪▪▪▪▪▪▪▪▪□ 94/100%

⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ▪▪▪▪▪▪▪▪▪□
95/100%

▪▪▪▪▪▪▪▪▪▪ 100/100%

分析案件をやり始めたときに陥っていたことの共有と対策 / DS project for beg...

分析案件をやり始めたときに陥っていたことの共有と対策 / DS project for beginner

Chitose

More Decks by Chitose

Other Decks in Technology

Featured

Transcript

分析案件をやり始めたときに陥っていたことの共有と対策ちとせちゃん (@chitose_ng_vrc)

後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%

このスライドは19年11⽉に作成した内容の固有名詞の⼀部を修正しただけなので当時のちとせ観点でのお話です Caution □□□□□□□□□□ 0/100%

Company Revisio株式会社 (旧TVISION INSIGHTS株式会社) Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ

2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト)

分析案件をやり始めたときによくあった会話

こんな感じのモデル考えてます！ ◦◦という手法もあると思うけどなんでこの手法なの？な、なんとなくっす。。。本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢

こんな感じのモデル考えてます！このモデル式だと☓☓に△△って仮定を置いてるってことだよね？あっ、はい多分そうっす。（言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ

何故なんとなく分析をしてしまうのか︖ Topic

何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない ▪□□□□□□□□□ 16/100%

1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていない ▪▪□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする ▪▪▪□□□□□□□ 37/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする何のために存在する⼿法︖ ▪▪▪▪□□□□□□ 40/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖ ▪▪▪▪□□□□□□ 42/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖ 類似⼿法との違いは、何故うまれたの︖ ▪▪▪▪□□□□□□ 45/100%

Random Forestと Gradient Boosting Decision Treeの違いを⾔えますか︖ Example ▪▪▪▪▪□□□□□ 50/100%

選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 60/100%

説明ができない部分は、考えていない部分選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 62/100%

次のモデルへの問いは何か Example ▪▪▪▪▪▪▪□□□ 70/100%

CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example

Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー +

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数

今⽇のまとめ Today’s Summary ▪▪▪▪▪▪▪▪▪□ 94/100%

▪▪▪▪▪▪▪▪▪▪ 100/100%