Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.2k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.1k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
4.5k
論文紹介: Cross-Market Product Recommendation
zerebom
1
110
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
1k
LLMを活用した推薦システムの改善: 課題と初期導入のアプローチ
zerebom
4
3.7k
ChatGPTとの会話のデータ分析: 開発対話を最適化するための指針と特性
zerebom
1
2k
RecSys2022 論文読み会 | 【紹介】Tutorial: Psychology-informed Recommender Systems
zerebom
0
750
Other Decks in Business
See All in Business
採用ピッチブック
macloud
1
47k
KADOKAWA Connected|会社紹介資料/Corporate Introduction
kadokawaconnected
4
49k
株式会社エビリー_会社紹介資料_ビジネス
eviryr_recruit
0
1.3k
2023年度ICT職専門研修(海外派遣研修)報告書 No.1
tokyo_metropolitan_gov_digital_hr
0
480
プライシングについて
umzws
0
760
AnyMind Group Company Deck (EN)
anymind
1
170k
ちゅらデータ会社紹介資料 / ChuraDATA Introduction
churadata
0
380
Smartwill Company Profile
1129panda
0
540
トーキトーク - 登記密着ヒューマンドラマ
takuro_nakajima
PRO
0
1.3k
LAST DISH - ラスメシ
takuro_nakajima
PRO
0
1.5k
プライシングについて②
umzws
0
220
400F 採用ピッチ資料
400f
0
130
Featured
See All Featured
Automating Front-end Workflow
addyosmani
1354
200k
The Pragmatic Product Professional
lauravandoore
24
5.8k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
20
1.6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
1
1.2k
Fireside Chat
paigeccino
19
2.6k
Ruby is Unlike a Banana
tanoku
95
10k
The Invisible Customer
myddelton
114
12k
GraphQLの誤解/rethinking-graphql
sonatard
49
9.2k
Into the Great Unknown - MozCon
thekraken
10
980
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
39
4.4k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
18
6.9k
Designing for Performance
lara
601
67k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的