Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
分析案件をやり始めたときに陥っていたことの共有と対策 / DS project for beg...
Search
Chitose
November 14, 2022
Technology
0
120
分析案件をやり始めたときに陥っていたことの共有と対策 / DS project for beginner
2019年11月に某LT会で発表したDS初心者向けの内容です。
当時のちとせの考えていたこと&スライドデザインセンスと考えてください。
分析案件をやるときにこういうこと考えないとなーって内容です。
Chitose
November 14, 2022
Tweet
Share
More Decks by Chitose
See All by Chitose
VRPDanceStudioちとせクラス第3回_体幹と体軸/ ChitoseClass_3_VRPDanceStudio
chitose_snn
0
17
VRPDanceStudioちとせクラス第1,2回_インターロック/ ChitoseClass_Interlock_VRPDanceStudio
chitose_snn
0
59
ゆるふわ因果推論入門 / casual talk about causal inference
chitose_snn
0
270
イベント参加者向けVRChatガチ初心者ガイド / VRChat for ultra beginner
chitose_snn
3
860
Notionによる情報収集と情報整理 / how_to_collect_information_by_notion
chitose_snn
0
110
Other Decks in Technology
See All in Technology
Tokyo RubyKaigi 12 - Scaling Ruby at GitHub
jhawthorn
2
170
ココナラのセキュリティ組織の体制・役割・今後目指す世界
coconala_engineer
0
210
2週に1度のビッグバンリリースをデイリーリリース化するまでの苦悩 ~急成長するスタートアップのリアルな裏側~
kworkdev
PRO
8
6.1k
ChatGPTを使ったブログ執筆と校正の実践テクニック/登壇資料(井田 献一朗)
hacobu
0
110
一人から始めたSREチーム3年の歩み - 求められるスキルの変化とチームのあり方 - / The three-year journey of the SRE team, which started all by myself
vtryo
7
5.3k
Plants vs thieves: Automated Tests in the World of Web Security
leichteckig
0
140
panicを深ぼってみる
kworkdev
PRO
1
130
Re:Define 可用性を支える モニタリング、パフォーマンス最適化、そしてセキュリティ
pyama86
9
5.2k
GitLab SelfManagedをCodePipelineのソースに設定する/SetGitLabSelfManagedtoCodePipeline
norihiroishiyama
1
110
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
17k
財務データを題材に、 ETLとは何であるかを考える
shoe116
5
1.9k
SIEMによるセキュリティログの可視化と分析を通じた信頼性向上プロセスと実践
coconala_engineer
1
2.7k
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
127
18k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
How to Ace a Technical Interview
jacobian
276
23k
A Tale of Four Properties
chriscoyier
157
23k
Thoughts on Productivity
jonyablonski
68
4.4k
Designing Experiences People Love
moore
139
23k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3.1k
VelocityConf: Rendering Performance Case Studies
addyosmani
327
24k
Scaling GitHub
holman
459
140k
Visualization
eitanlees
146
15k
Raft: Consensus for Rubyists
vanstee
137
6.7k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.8k
Transcript
分析案件をやり始めたときに 陥っていたことの共有と対策 ちとせちゃん (@chitose_ng_vrc)
後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%
このスライドは19年11⽉に作成した内容 の固有名詞の⼀部を修正しただけなので 当時のちとせ観点でのお話です Caution □□□□□□□□□□ 0/100%
Company Revisio株式会社 (旧TVISION INSIGHTS株式会社) Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ
Other DS⽤アカウント→チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール NO PRESENTATION ?/100%
2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト)
R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ͖ʗ 経歴 □□□□□□□□□□ 6/100%
分析案件をやり始めたときに よくあった会話
こんな感じのモデル考えてます! ◦◦という手法もあると思うけど なんでこの手法なの? な、なんとなくっす。。。 本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢
ʗ ▪□□□□□□□□□ 10/100%
こんな感じのモデル考えてます! このモデル式だと☓☓に△△って仮定を置 いてるってことだよね? あっ、はい多分そうっす。 (言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ
͢ ʗ ▪□□□□□□□□□ 12/100%
何故なんとなく分析をしてしまうのか︖ Topic
何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない ▪□□□□□□□□□ 16/100%
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない ▪▪□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない テキトーにそれっぽい⼿法を選ぶ理由 テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ▪▪□□□□□□□□
26/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーにそれっぽい⼿法を選ぶ理由 ▪▪▪□□□□□□□ 35/100%
何故なんとなく分析をしてしまうのか
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする ▪▪▪□□□□□□□ 37/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ ▪▪▪▪□□□□□□ 40/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ ▪▪▪▪□□□□□□ 42/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ ▪▪▪▪□□□□□□ 45/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ 類似⼿法との⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習
Random Forestと Gradient Boosting Decision Treeの違いを ⾔えますか︖ Example ▪▪▪▪▪□□□□□ 50/100%
何故モデルをなんとなく作るか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由
▪▪▪▪▪□□□□□ 57/100%
選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 60/100%
説明ができない部分は、 考えていない部分 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 62/100%
説明ができない部分は、 考えていない部分 この思考を繰り返すと、 考えて要素を⼊れられるようになる 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 67/100%
次のモデルへの問いは何か Example ▪▪▪▪▪▪▪□□□ 70/100%
CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example
▪▪▪▪▪▪▪□□□ 72/100%
Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー +
定数 ▪▪▪▪▪▪▪□□□ 74/100% どういう仮定を置いたモデル式なのか
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪□□□ 78/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 82/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 83/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 87/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖ 何を問えばいいのかは慣れが必要。 はじめは上司に⼿伝ってもらおう。
今⽇のまとめ Today’s Summary ▪▪▪▪▪▪▪▪▪□ 94/100%
⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ▪▪▪▪▪▪▪▪▪□
95/100%
▪▪▪▪▪▪▪▪▪▪ 100/100%