Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.3k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
Polarsの成長: v0.14からv1.0までの変遷と今後の展望
zerebom
1
350
ダッシュボードを使ってもらうには、 現場へのヒアリングが重要だと 改めて気づいた話
zerebom
4
1.5k
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1.2k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.3k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
5k
論文紹介: Cross-Market Product Recommendation
zerebom
1
120
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
1.6k
LLMを活用した推薦システムの改善: 課題と初期導入のアプローチ
zerebom
4
3.9k
ChatGPTとの会話のデータ分析: 開発対話を最適化するための指針と特性
zerebom
1
2.1k
Other Decks in Business
See All in Business
20240725_UPDATER_companysummary
updater_pr
0
39k
セブンデックス 採用資料
sevendex
2
3.6k
自社サービスをお客様が簡単に利用出来る為にやったこと
yako1060
0
110
recruit
dxyz
0
7.9k
LayerXのOpsについて
suuu
2
800
VISASQ: ABOUT US
eikohashiba
14
440k
240722_CobeAssocie_121-changes-in-lifestyle-2024_vol18.pdf
nozomi
0
110
20240712_CM_Odyssey
hideki_ojima
1
190
K.S.ロジャース会社紹介資料
ksr_hiring
1
1.9k
Rでコンジョイント分析 2024年版
bob3bob3
0
300
インキュデータ会社紹介資料
okitsu
1
25k
DevIO2024_16_9_OnlineSlide_template 0708登壇資料_yukoyagi
yukoyagi
0
330
Featured
See All Featured
Navigating Team Friction
lara
181
13k
Fireside Chat
paigeccino
25
2.8k
Building a Modern Day E-commerce SEO Strategy
aleyda
25
6.7k
The Invisible Customer
myddelton
117
13k
Producing Creativity
orderedlist
PRO
340
39k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
16
1.6k
No one is an island. Learnings from fostering a developers community.
thoeni
17
2.8k
Thoughts on Productivity
jonyablonski
64
4.1k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.3k
Embracing the Ebb and Flow
colly
81
4.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
262
13k
Writing Fast Ruby
sferik
623
60k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的