Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
XP に取り組むデータサイエンティストが思うこと
Search
Kenji Tanaka
March 29, 2023
Programming
730
1
Share
XP に取り組むデータサイエンティストが思うこと
Kenji Tanaka
March 29, 2023
Other Decks in Programming
See All in Programming
ふりがな Deep Dive try! Swift Tokyo 2026
watura
0
230
「話せることがない」を乗り越える 〜日常業務から登壇テーマをつくる思考法〜
shoheimitani
4
830
AI時代のPhpStorm最新事情 #phpcon_odawara
yusuke
0
190
The Monolith Strikes Back: Why AI Agents ❤️ Rails Monoliths
serradura
0
340
煩雑なSkills管理をSoC(関心の分離)により解決する――関心を分離し、プロンプトを部品として育てるためのOSSを作った話 / Solving Complex Skills Management Through SoC (Separation of Concerns)
nrslib
4
980
JOAI2026 1st solution - heron0519 -
heron0519
0
140
「Linuxサーバー構築標準教科書」を読んでみた #ツナギメオフライン.7
akase244
0
1.4k
アーキテクチャモダナイゼーションとは何か
nwiizo
19
5.3k
Claude Codeをカスタムして自分だけのClaude Codeを作ろう
terisuke
0
140
ハーネスエンジニアリングとは?
kinopeee
11
5.8k
10年分の技術的負債、完済へ ― Claude Code主導のAI駆動開発でスポーツブルを丸ごとリプレイスした話
takuya_houshima
0
2.6k
Offline should be the norm: building local-first apps with CRDTs & Kotlin Multiplatform
renaudmathieu
0
220
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
310
The Language of Interfaces
destraynor
162
26k
The Invisible Side of Design
smashingmag
303
52k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
53k
4 Signs Your Business is Dying
shpigford
187
22k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
680
[SF Ruby Conf 2025] Rails X
palkan
2
970
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
180
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
160
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
440
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
170
Transcript
XP に取り組む データサイエンティストが思うこと 2023/03/28 田中 賢治
自己紹介 田中 賢治 • 2021/03 Uzabase 入社(3社目) • データサイエンスを始めたきっかけ: 2社目で悪質コメント分類のプロジェクト
を担当した時。それまでは Rails でバック エンドの開発をやってました。 • 趣味: 大学(UEC夜間在学中) • 最近ハマっていること: 大量の鶏皮から鶏油を抽出すること 2
3 初めての技術イベント登壇です。 暖かい目で見ていただけると嬉しいです。
この発表で伝えたいこと 4
データサイエンティストに対しても XP はいいぞ! 5
データサイエンティストのつらみ 6
1. PoC死 2. データを集めるのが大変 3. プロダクトへの組み込みが大変 4. … データサイエンティストのつらみ 7
1. PoC死 2. データを集めるのが大変 3. プロダクトへの組み込みが大変 4. … データサイエンティストのつらみ 8
XP で解消される 話をします
1. PoC死 9
1. PoC死 10 中島 洋一 . “AI導入の失敗あるある、「 PoC死」の罠とは。” . NewsPicks
. 2020/01/14 . https://newspicks.com/news/4494535/body/ “例えばよくあるのが「とりあえず作ってみよう。PoCの精度は 高ければ高いほどいいね!」とゴールが曖昧なままスタートす ることがあります。これでは、機械学習エンジニアとプラン ナー、マネージャーとで認識が違った状態でプロジェクトが進 んでしまいます。そしてPoCを作った後に、こうした認識の違い が明らかになり、炎上に近い「PoC死」を招くのです。”
1. PoC死 11 ゴールが曖昧なまま スタート ↓ 認識が違った状態で プロジェクトが進む ↓ PoC実装後に認識の違いが
明らかになり炎上
1. PoC死 12 XP があると なぜ「PoC死」しない??
1. PoC死 13 ストーリー 週次サイクル
1. PoC死 14 ゴールが曖昧なまま スタート ↓ 認識が違った状態で プロジェクトが進む ↓ PoC実装後に認識の違いが
明らかになり炎上 XP があると... 「ストーリー」でユーザーの価値 を明文化 ↓ 「週次サイクル」でゴールの認識 が揃った状態を保つ ↓ 「PoC死」しない
プロダクトマネー ジャーは mecab-ipadic-NEolo gd を辞書に指定した 業界推定モデルを訓 練した時のスコアを 知っている。 1. PoC死
15 ストーリー = ユーザーの価値を明文化したチケットのようなもの→ ビジ ネスサイドにも伝わる ユーザーは SPEEDA で企業情 報に新語を多く含む 企業に正しく業界が 紐づいていることを確 認できる。 実験のストーリーの例 実装のストーリーの例 NEologd を辞書にして実験 新語を扱うモデルになってる か確認 →
1. PoC死 16 週次サイクル → ゴールに向かってフィードバックサイクルを回す 実験 評価 フィードバック 実装
良い精度が出たら … … … … 施策のたびに実験のストーリーを書く ストーリー書く
1. PoC死 17 フィードバックサイクルを回して ユーザーに価値を届ける!
2. データを集めるのが大変 18
2. データを集めるのが大変 19 • データの居場所がわからない • アクセス権限をもらうための社内調整が大変 → チーム間連携の壁に阻まれる
2. データを集めるのが大変 XP はどうやって チーム間連携の壁を 超えているのか?? 20
全員同席 2. データを集めるのが大変 21
2. データを集めるのが大変 22 Product Team ソフトウェアエンジニア( SwE) データサイエンティスト( DS) サイトリライアビリティエンジニア(
SRE) テストエンジニア(TE) → Gather (リモートオフィス)に全員同席
23
24 SRE SwE + TE DS SwE + TE SwE
+ TE SwE + TE
わからないことは サクッと聞いて サクッと解決! → XP のバリューを共有しているからこそできること 2. データを集めるのが大変 25
2. データを集めるのが大変 26 XP のバリュー 1. コミュニケーション 2. シンプリシティ 3.
フィードバック 4. 勇気 5. リスペクト
3. プロダクトへの組み込みが大変 27
3. プロダクトへの組み込みが大変 28 • プロダクトによってインフラが違う • プロダクトによって言語が違う → スキルの壁に阻まれる
3. プロダクトへの組み込みが大変 29 XP はどうやって スキルの壁を 超えているのか??
3. プロダクトへの組み込みが大変 30 ペアプロ
3. プロダクトへの組み込みが大変 31 Product Team XP ソフトウェアエンジニア( SwE) データサイエンティスト( DS)
サイトリライアビリティエンジニア( SRE) テストエンジニア(TE)
3. プロダクトへの組み込みが大変 32 Product Team XP ソフトウェアエンジニア( SwE) テストエンジニア(TE) データサイエンティスト(
DS) サイトリライアビリティエンジニア( SRE) 「バリュー」「原則」「プラクティス」 の共有 • 常時ペアプロ • 常時 TDD • トランクベース開発 • 継続的デリバリー • ストーリー • 週次サイクル • 四半期サイクル • 朝会 • ふりかえり • …
3. プロダクトへの組み込みが大変 33 Product Team XP ソフトウェアエンジニア( SwE) テストエンジニア(TE) データサイエンティスト(
DS) サイトリライアビリティエンジニア( SRE) 「バリュー」「原則」「プラクティス」の 共有 • 常時ペアプロ • 常時 TDD • トランクベース開発 • 継続的デリバリー • ストーリー • 週次サイクル • 四半期サイクル • 朝会 • ふりかえり • … → 「プラクティス」を通じた連携 → 職種を超えたペアプロ
3. プロダクトへの組み込みが大変 34 スキルを補完し合い 相乗効果で成果を出す!
まとめ 35 データサイエンティストのつらみ PoC死 データを集めるのが大変 プロダクトへの組み込みが大変 ストーリー 週次サイクル 全員同席 ペアプロ
有効なプラクティス フィードバックサイクルを回して ユーザーに価値を届ける! わからないことは サクッと聞いてサクッと解決! スキルを補完し合い 相乗効果で成果を出す! 目指すもの
とはいえ、、 XP で全てが解決できるわけではない 36
37 精度を評価 R&D 実装 プロダクトマネージャー は mecab-ipadic-NEologd を辞書に指定した業界 推定モデルを訓練した 時のスコアを知ってい
る。 ユーザーは SPEEDA で企業情報に新語を多 く含む企業に正しく業界 が紐づいていることを 確認できる。 実験の実装 実験を実行し てスコアを出 力 精度が良かったら CD パイプライン - モデル訓練 - モデルリリース - API デプロイ TDD で実装 CI パイプライン - 自動テスト
38 精度を評価 R&D 実装 プロダクトマネージャー は mecab-ipadic-NEologd を辞書に指定した業界 推定モデルを訓練した 時のスコアを知ってい
る。 ユーザーは SPEEDA で企業情報に新語を多 く含む企業に正しく業界 が紐づいていることを 確認できる。 実験の実装 実験を実行し てスコアを出 力 精度が良かったら CD パイプライン - モデル訓練 - モデルリリース - API デプロイ TDD で実装 CI パイプライン - 自動テスト
39 精度を評価 R&D 実装 プロダクトマネージャー は mecab-ipadic-NEologd を辞書に指定した業界 推定モデルを訓練した 時のスコアを知ってい
る。 ユーザーは SPEEDA で企業情報に新語を多 く含む企業に正しく業界 が紐づいていることを 確認できる。 実験の実装 実験を実行し てスコアを出 力 精度が良かったら CD パイプライン - モデル訓練 - モデルリリース - API デプロイ TDD で実装 CI パイプライン - 自動テスト CD4ML ???