Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
プロダクト観点で考えるデータ基盤の育成戦略 / Growth Strategy of Data...
Search
yamamoto-yuta
January 30, 2025
Technology
2.2k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
プロダクト観点で考えるデータ基盤の育成戦略 / Growth Strategy of Data Analytics Platforms from a Product Perspective
登壇イベント:
https://datatech-jp.connpass.com/event/335207/
yamamoto-yuta
January 30, 2025
More Decks by yamamoto-yuta
See All by yamamoto-yuta
プロダクトデザイナーに学ぶ、『見る気が起きる』ダッシュボードの作り方 / Creating Engaging Dashboards: Lessons from Product Designers
yamamotoyuta
3
860
「必要とされるデータ基盤」であり続けるためにやってきたこと / What We've Done to Make a Needed Data Analytics Platforms Grow
yamamotoyuta
0
600
他チームへ越境したら、生データ提供ソリューションのクエリ費用95%削減へ繋がった話 / Cross-Team Impact: 95% Off Raw Data Query Costs
yamamotoyuta
0
870
ヤプリのデータカタログ整備 1年間の歩み / Progress of Building a Data Catalog at Yappli
yamamotoyuta
4
4.2k
私のdbt布教用資料 〜TROCCOUG Ver.〜 / My Guide to Evangelizing dbt - TROCCOUG Ver.
yamamotoyuta
1
3.2k
データカタログの最初の一歩 〜データ組織向けに dbt docs を整備している話〜 / Maintaining dbt docs for data organizations
yamamotoyuta
2
3.6k
次の10年を戦える分析用データ基盤構築の第一歩 - dbtによる基盤刷新とクエリ費用90%削減への取り組み -
yamamotoyuta
1
2.1k
技術書LT #11 実践 Docker - ソフトウェアエンジニアの「Docker よくわからない」を終わりにする本
yamamotoyuta
0
1.8k
Other Decks in Technology
See All in Technology
Disciplined Vibes: Scaling AI-Assisted Engineering
sheharyar
0
120
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
630
タクシーアプリ『GO』の実践的データ活用
mot_techtalk
3
190
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.9k
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
130
エンジニアリング戦略の作り方 / Crafting Engineering Strategy
iwashi86
18
6.3k
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
250
フロンティアAIのゲート化と地政学リスク
nagatsu
0
110
自律型AIエージェントは何を破壊するのか
kojira
0
140
MCP Appsを作ってみよう
iwamot
PRO
4
410
Agentic Web
dynamis
1
200
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
620
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
698
190k
The SEO Collaboration Effect
kristinabergwall1
1
480
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
30 Presentation Tips
portentint
PRO
1
320
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
The Pragmatic Product Professional
lauravandoore
37
7.3k
Are puppies a ranking factor?
jonoalderson
1
3.5k
RailsConf 2023
tenderlove
30
1.5k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
730
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
Transcript
プロダクト観点で考える データ基盤の育成戦略 みんなの考えた最強のデータアーキテクチャ〜2025もやってきましょうSP! 株式会社ヤプリ ⼭本 雄太
SPEAKER 開発統括本部 プロダクト開発本部 データサイエンス室 ⼭本 雄太 • 2023年に新卒⼊社 • dbt導⼊に際して、開発体制やリリースフローなどの 構築を担当
• 最近はデータカタログ拡充‧ドキュメント整備に取 り組み中 • pUG(旧TROCCOUG)の運営にも携わらせていただ いています
ヤプリの製品|ノーコードのアプリ開発プラットフォーム「Yappli」 • 700社以上が導⼊、800アプリ以上を提供 • 40種類以上の機能が利⽤可能。多様なシーンに合致したアプリが作成可能
ヤプリの製品|Yappli 導⼊顧客向けにアナリティクスサービスを提供 CMS ダッシュボード Yappli 管理画⾯のトップに 表⽰されるダッシュボード Yappli Data Hub
アプリ内の⾏動データや属性データを ユーザ単位で分析を可能にする データ連携サービス Yappli Analytics アプリログを網羅した分析や、 機能別に特化した分析が可能な ダッシュボード
今回お話しすること • ヤプリのデータ基盤の成り⽴ち • 「プロダクトの⼀部としてのデータ基盤」における育成戦略
ヤプリのデータ基盤の珍しい成り⽴ち 1. 社内でデータ活⽤のニーズが発⽣ 2. ニーズに応えることでデータ基盤が 誕⽣ 3. さらなるニーズ発⽣→対応を繰り返 しながらデータ基盤が成⻑ 1.
YappliのCMSにダッシュボード機能 をつけるためにデータ基盤が誕⽣ 2. ダッシュボード機能を強化するため にデータ基盤を強化 3. ダッシュボード機能以外でも使われ るデータ基盤に成⻑ よくあるデータ基盤の成り⽴ち ヤプリのデータ基盤の成り⽴ち プロダクトの⼀機能として作られ育てられてきた
INDEX ⽬次 1. GA360期 2. 内製基盤:⽴ち上げ期 3. 内製基盤:安定期 4. データ基盤独⽴期
5. これまでを振り返って 6. まとめ
GA360期(2019年〜2021年) 1. GA360期 アプリの 操作ログ GA360 BigQuery 集計バッチ& ダッシュボード表⽰⽤DB Yappliの
CMSダッシュボード GA360で操作ログをトラッキングし、 BigQueryへストリーミングエクスポート CMSにアクティブユーザ数の推移などを表⽰する ダッシュボード機能を提供 ポイント💡|当時はまだ社内にデータ⼈材(データサイエンティストなど)はいなかった • PdM、エンジニアが設計‧実装 • BigQueryに蓄積されたデータはCMSダッシュボード以外には使われていなかった
内製基盤:⽴ち上げ期(2021年〜2022年) • GoogleからGA360→GA4への移⾏アナウンスが出た • さらなる事業成⻑のため、YappliのCMSを刷新したい ◦ 開発速度やユーザ体験を向上させたい • アプリのプラットフォーマーとして、データを武器にしていきたい ◦
アプリのプラットフォーマーだからこそ、様々なアプリの利⽤ログを蓄積できる ◦ 1⼈⽬のデータ⼈材(データサイエンティスト)の⼊社 • YappliのCMS刷新※に併せてデータ基盤も刷新 ◦ トラッキング機構を内製して脱GA360 • 蓄積したデータを活⽤する新サービス「Yappli Data Hub」の提供を開始 ◦ CMSダッシュボード以外のデータ提供先ができた 2. 内製基盤:⽴ち上げ期 ※ … 詳細はこちら: https://whatweuse.dev/article/yappli
新データ基盤の構成図 2. 内製基盤:⽴ち上げ期 アプリの 操作ログ 内製トラッキング機構※ BigQuery 集計バッチ& ダッシュボード表⽰⽤DB YappliのCMS
ダッシュボード Yappli Data Hub 集計バッチ NEW!! NEW!! NEW!! ポイント💡|DWH層は設けず、Data Lake層から1テーブル1クエリの⼀気通貫でMart層を作成 • 基盤の⽴ち上げ期はどんなトラブル‧問い合わせが来るかわからない → アーキテクチャをシンプルにして、トラブル発⽣時の影響範囲を⼩さくして対処しやすくした • デメリット: 同じ集計処理を何度も⾛らせることになる(=時間、お⾦の無駄が⼤きい) → 新データ基盤&刷新後のCMSダッシュボード‧Yappli Data Hubサービスをまずは軌道に載せる ※ … 詳細はこちら: https://cloud.google.com/customers/yappli?hl=ja
内製基盤:安定期(2022年〜2023年) 3. 内製基盤:安定期 アプリの 操作ログ 内製トラッキング機構 BigQuery 集計バッチ& ダッシュボード表⽰⽤DB YappliのCMS
ダッシュボード Yappli Data Hub 集計バッチ Looker カスタムダッシュボード (Yappli Data Hub) TROCCO 社内問い合わせ NEW!! NEW!! NEW!! • 社内からの集計依頼や問い合わせが増加 • データ連携ツールとしてTROCCOを導⼊※ ◦ Yappli Data Hubにて、Lookerを使ったカスタム ダッシュボードの提供開始 ◦ 営業部⾨でLookerを使ったレポーティング開始 ポイント💡|TROCCO上でデータモデリングが洗練されていった • 共通指標の誕⽣ ◦ アクティブユーザ数、PV数、プッシュ開封率、etc. • 共通データマート作成ワークフローの誕⽣ ◦ =DWH層の誕⽣ ※ … 詳細はこちら: https://primenumber.com/cases/yappli
データ基盤独⽴期(2023年〜) • シンプルさ重視で許容していた無駄が許容できなくなってきた(特にお⾦) • データ⼈材1⼈体制では回らなくなってきた • データ⼈材を増やしてデータマネジメントを強化 ◦ 2023年に2⼈(うち1⼈が私)、2024年に1⼈の新メンバーが⼊社 ◦
TROCCOで動いているワークフローのうち、共通データマート作成部分をdbtへ移⾏ ◦ Data Lake層から直接Mart層を作っていたCMSダッシュボードやYappli Data Hubに対して、 dbtで作ったDWH層への繋ぎかえを実施 4. データ基盤独⽴期 CMSダッシュボードのためのデータ基盤だったものが完全に独り⽴ち
現在のデータ基盤の構成図(※取り組み中のものも含む) 4. データ基盤独⽴期 アプリの 操作ログ 内製トラッキング機構 BigQuery (Data Lake層) データ設置バッチ&
ダッシュボード表⽰⽤DB YappliのCMS ダッシュボード Yappli Data Hub データ設置バッチ Looker カスタムダッシュボード (Yappli Data Hub) TROCCO (データ設置) 社内問い合わせ dbt※ BigQuery (DWH層/Mart層) NEW!! NEW!! UPDATE UPDATE UPDATE 集計ロジックはdbtへ集約 TROCCO (社内⽤途) NEW!! 社内からの集計依頼など柔軟性が求められるものは 引き続きTROCCOで対応 (要件が固まってきたらdbtへ移⾏) 元からあった各集計バッチはdbtが作成したデータマートを 各データ提供先へ設置するバッチに ※ … 詳細はこちら: https://tech.yappli.io/archive/category/dbt
これまでを振り返って 5. これまでを振り返って
5. これまでを振り返って 1. 社内でデータ活⽤のニーズが発⽣ 2. ニーズに応えることでデータ基盤が誕⽣ 3. さらなるニーズ発⽣→対応を繰り返しながら データ基盤が成⻑ 1.
YappliのCMSにダッシュボード機能をつける ためにデータ基盤が誕⽣ 2. ダッシュボード機能を強化するためにデータ 基盤を強化 3. ダッシュボード機能以外でも利⽤可能なデー タ基盤に成⻑ よくあるデータ基盤の成り⽴ち ヤプリのデータ基盤の成り⽴ち
5. これまでを振り返って 1. 社内でデータ活⽤のニーズが発⽣ 2. ニーズに応えることでデータ基盤が誕⽣ 3. さらなるニーズ発⽣→対応を繰り返しながら データ基盤が成⻑ 1.
YappliのCMSにダッシュボード機能をつける ためにデータ基盤が誕⽣ 2. ダッシュボード機能を強化するためにデータ 基盤を強化 3. ダッシュボード機能以外でも利⽤可能なデー タ基盤に成⻑ よくあるデータ基盤の成り⽴ち ヤプリのデータ基盤の成り⽴ち 社内ニーズを軸にSmall start, Quick winで育成 Yappli契約顧客を軸にSmall start, Quick winで育成 実は本質的には同じ育成戦略 どちらも「データ利⽤者を軸にSmall start, Quick winで育成」
そもそも育成戦略とか考えてなかった😇 • 元々YappliのCMSにダッシュボード機能を作るために作られたデータ基盤 • 当時はデータ⼈材がいない状況だった → データ活⽤推進を⽬的にロードマップが敷かれていた訳ではなかった • その場その場で「今できる最善策」を採り続けた結果、よくあるデータ基盤 と同じ育成戦略になった 5.
これまでを振り返って 何をもって「最善」と判断していたのか?
何をもって「最善」と判断していたのか? • データ利⽤者が成功体験を積み重ねやすいこと = 「最善」 5. これまでを振り返って データ利⽤者 成功したいもの やったこと ① GA360
Yappli契約顧客 (アプリ運⽤者) アプリの運⽤ (⾃社アプリのユーザの新規獲得‧育成 etc.) • CMSにダッシュボード機能をつける ② 内製基盤: ⽴ち上げ期 Yappli契約顧客 (アプリ運⽤者) アプリの運⽤(もっと) (⾃社アプリユーザのロイヤルカスタマー化 etc.) • CMSダッシュボードの強化 • Yappli Data Hubの提供開始 ③ 内製基盤: 安定期 社内 (営業、CS etc.) ⾃⾝の業務 (より良い顧客提案、受注 etc.) • 社内依頼対応 ④ データ基盤 独⽴期 全てのデータ利⽤者 各々の今まで‧これからのさらな る成功 • データ基盤の独⽴ • データマネジメントの強化 データ利⽤者が成功体験を積み重ねる = 信⽤貯⾦UP↑ → 貯めた信⽤貯⾦でデータ基盤を育成
「今できる最善策」を採り続けるために • 負債の拡⼤を恐れない ◦ 後から負債解消に取り組んだ⽅が今取り組むより簡単なことがある ▪ ニーズ⾃体が消失して、そもそも負債解消が不要になった ▪ より良いソリューションが登場して、負債解消に取り組みやすくなっている •
特に、早すぎる共通化‧最適化に気を付ける(誘惑に耐える) ◦ データ利⽤者の成功にMUSTなことは「早く集計結果を届けること(正確であることは前提として)」 → 「その集計過程が綺麗に整ってること」はMUSTではない ▪ データ利⽤者が成功を積み重ねないと、データ基盤は成⻑しない = 早くから共通化‧最適化に取り組んでもデータ基盤が成⻑しなかったら無意味 → 共通化‧最適化の誘惑に負けず、「正確な集計結果を”早く届ける”」を徹底する ◦ データ利⽤者の需要に追いつけなくなってきたくらいでようやく取り組み始める ▪ 何を共通化‧最適化すべきかの勘所が磨かれている状態 → 良いデータ基盤が設計できる 5. これまでを振り返って
共通化‧最適化に取り組むにあたって 「データ利⽤者の需要に追いつけなくなってきたくらいでようやく取り組み始める」 → 余裕がない状況下でどうやって共通化‧最適化に取り組めば…? ヤプリが良かったところ: • 新メンバーを採⽤し、既存業務ではなく共通化‧最適化業務に割り当てた ◦ 元から在籍していたメンバー(1⼈) ▪ 引き続きデータ利⽤者の需要に応え続ける
◦ 新たに⼊社したメンバー(2⼈) ▪ 共通化‧最適化に取り組む 5. これまでを振り返って データ利⽤者へのレスポンス速度を維持しつつ、 別業務の割り込みを抑えてスムーズに共通化‧最適化を進められた
まとめ 6. まとめ
まとめ • データ基盤は社内ニーズだけでなく、プロダクトの⼀機能から誕⽣すること もある • どのような誕⽣の仕⽅であっても、育成戦略は同じ • 育成のコツ: ◦ 最初はDWH層を設けずData
Lake層から⼀気通貫でMart層を作ることで、データ利⽤者が早 く成功体験を積み重ねられるようにする(=信⽤貯⾦を作る) ▪ 負債の拡⼤を恐れないことが⼤事。特に早すぎる共通化‧最適化の誘惑には耐えよう ◦ ⼀気通貫スタイルに限界が来たら、信⽤貯⾦を元⼿にDWH層を作って共通化‧最適化に取り 組む ▪ これまでの知⾒から、何を共通化‧最適化すべきかが⾒えるはず 6. まとめ ⽬指せ!⾃分の考えた最強のデータアーキテクチャ!💪