Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.4k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
Pythonによるネットワーク分析の基礎とコミュニティサクセスへの応用
zerebom
4
1k
Polarsの成長: v0.14からv1.0までの変遷と今後の展望
zerebom
1
800
ダッシュボードを使ってもらうには、 現場へのヒアリングが重要だと 改めて気づいた話
zerebom
4
1.8k
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1.7k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.7k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
5.4k
論文紹介: Cross-Market Product Recommendation
zerebom
1
180
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
2.2k
LLMを活用した推薦システムの改善: 課題と初期導入のアプローチ
zerebom
4
4.2k
Other Decks in Business
See All in Business
ゲーム型メンタルヘルス研修「ストマネ」
chibanba1982
PRO
0
150
メドピアグループ紹介資料
medpeer_recruit
10
120k
株式会社B4A 会社紹介
b4a
0
5.8k
良い仮説を評価する技術
tumada
PRO
21
6.8k
地図作成ゲーム「ジグソータウン」
chibanba1982
PRO
0
120
経営シミュレーションゲーム「ペーパータワーforビジネス」
chibanba1982
PRO
0
320
フォロワーシップ、ビジョン共有の重要性を学べる「部課長ゲームオンライン」
chibanba1982
PRO
0
160
採用ピッチ資料
beglobal_document
0
300
ジグソーメソッドを用いた情報整理ゲーム「桃太郎村の地図カード版」の説明資料
chibanba1982
PRO
0
190
コンセンサスゲーム「無人島での出来事」
chibanba1982
PRO
0
180
comorebi_cultuerdeck_2025
comorebi_tokyo
0
280
Digital Experience, Inc. - Company Deck
sprasiainc
0
18k
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
3
330
Put a Button on it: Removing Barriers to Going Fast.
kastner
59
3.6k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
KATA
mclloyd
29
14k
Adopting Sorbet at Scale
ufuk
74
9.1k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
850
4 Signs Your Business is Dying
shpigford
182
21k
Measuring & Analyzing Core Web Vitals
bluesmoon
5
190
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
33
2.7k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Bash Introduction
62gerente
609
210k
Building an army of robots
kneath
302
44k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的