Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.2k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1.1k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.2k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
4.7k
論文紹介: Cross-Market Product Recommendation
zerebom
1
110
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
1.3k
LLMを活用した推薦システムの改善: 課題と初期導入のアプローチ
zerebom
4
3.8k
ChatGPTとの会話のデータ分析: 開発対話を最適化するための指針と特性
zerebom
1
2.1k
RecSys2022 論文読み会 | 【紹介】Tutorial: Psychology-informed Recommender Systems
zerebom
0
780
Other Decks in Business
See All in Business
SoVaで広がる会計士受験生のキャリア
sova_inc
0
410
採用ピッチ資料のご紹介
oneterasu
0
280
【25卒新卒採用】(株)エグゼクション/会社紹介資料
exe_recruit
0
350
JBUG 京都#1 ボードに機能追加する拡張機能を作った話
toranoana
1
170
開発組織のOKRの作り方 / OKR in a development division
kakehashi
14
5.1k
ドキュメンテーションを はじめよう
naopr
3
270
dbt testを導入した話
creativesurvey
0
210
CADDi 会社紹介・採用説明資料
caddi_eng
11
650k
0年目から意識したい、スピーディーに誤解無くコミュニケーションを取る方法
brainpadpr
4
2k
出版社こそデータドリブンに!Databricksを活用したデータ民主化への第一歩
mukubayashi
1
160
2024年12月期 第1四半期 決算説明資料
mobcast20040326
PRO
0
930
SUSEI Inc.CultureDeck
suisei
0
520
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
268
39k
Designing with Data
zakiwarfel
96
4.9k
Code Review Best Practice
trishagee
56
16k
The Cult of Friendly URLs
andyhume
74
5.7k
The Illustrated Children's Guide to Kubernetes
chrisshort
32
47k
GraphQLとの向き合い方2022年版
quramy
33
13k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
41
4.5k
10 Git Anti Patterns You Should be Aware of
lemiorhan
650
58k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
246
20k
Music & Morning Musume
bryan
42
5.7k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.1k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
20
1.8k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的