Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Databricks連携で実現する DWHモダナイゼーション

Databricks連携で実現する DWHモダナイゼーション

「第1回 Youは何しにDatabricksへ!?」でお話いただいたマネーフォワード様の資料です

Avatar for Databricks Japan

Databricks Japan

August 13, 2025
Tweet

More Decks by Databricks Japan

Other Decks in Technology

Transcript

  1. Yamazaki Junya Data Strategy Office  Data Engineering Division DRE Group

    2021年2月マネーフォワードに入社 現在の分析基盤を構築。 最近はデータ・インフラの統合、最適化に注 力しています。
  2. Agenda 1. Platform概要
 2. Project Raven
 3. アーキテクチャ Before &

    After
 4. Platform統合の上り方
 5. Ravenとは
 6. まとめ

  3. 分析基盤 概要 3種類の基盤が存在
 - Crow, AWS databricks 
 - セキュアな環境


    - InfoDB, GCP Bigquery in tokyo 
 - 次にセキュアな環境
 - Fractal, GCP Bigquery in US 
 - カジュアルな環境

  4. 分析基盤 概要 3種類の基盤が存在
 - Crow, AWS databricks 
 - セキュアな環境


    - InfoDB, GCP Bigquery in tokyo 
 - 次にセキュアな環境
 - Fractal, GCP Bigquery in US 
 - カジュアルな環境

  5. Project Raven databricks統合 in Raven Poject
 • 統合化されたCrow+InfoDB environment
 ◦

    New databricks workspace for Raven
 • リソースは全てコード管理
 ◦ インフラ、ジョブ共に
 • 環境はDatabricks
 • 閉塞環境での提供

  6. 分析基盤 概要 3種類の基盤が存在
 - Crow, AWS databricks 
 - セキュアな環境


    - InfoDB, GCP Bigquery in tokyo 
 - 次にセキュアな環境
 - Fractal, GCP Bigquery in US 
 - カジュアルな環境

  7. Project Raven Difference 
 • For Crow User
 ◦ 以下が提供開始


    ▪ serverless SQL warehouse
 ◦ 管理がUnity Catalog移行
 ▪ Data lineage
 ▪ Data quority
 ▪ Permission control
 • For InfoDB User
 ◦ Databricks consoleが利用可能
 ▪ Auto complete
 ▪ Suggest
 ▪ Chat with LLM
 • Query optimization
 ▪ Save query
 ▪ Query history 
 ◦ それぞれのユーザ単位で Auditlogが 自動保存される

  8. 分析基盤 Before 3種類の基盤が存在
 - Crow, AWS databricks 
 - セキュアな環境


    - InfoDB, GCP Bigquery in tokyo 
 - 次にセキュアな環境
 - Fractal, GCP Bigquery in US 
 - カジュアルな環境

  9. 分析基盤 After 2種類の基盤に統合
 - Raven, AWS databricks 
 - セキュアな環境


    - 次にセキュアな環境を兼ねる
 - Fractal, GCP Bigquery in US
 - カジュアルな環境

  10. Platform 統合 Phase 1 3つにフェーズ分け
 - Phase 1:
 - Create

    new workspace
 - 既存の環境からデータを 読む
 - 既存の環境は触らない
 これで
 • 閉塞環境下での挙動の確認
 • 権限統制の確認

  11. Platform 統合 Phase 2 - Phase 2:
 - CrowとInfoDBのETLを実施 


    - InfodbがFractalへの踏 み台に
 - S3→GCSは継続
 
 これで
 • 両環境の比較可能
 

  12. Platform 統合 Phase 3 - Phase 3:
 - 統合
 -

    DWHの役割を完全移行
 - マートはBigqueryに
 - これはアナリスト、 マーケターなどの ユースケースに依存

  13. Project Raven databricks統合 in Raven Poject
 • 統合化されたCrow+InfoDB environment
 ◦

    New databricks workspace for Raven
 • リソースは全てコード管理
 ◦ インフラ、ジョブ共に
 • 環境はDatabricks
 • 閉塞環境での提供

  14. Raven CI/CD ほぼ全てのリソースが IaC対象
 - Infra
 - Terraform
 - Job


    - Databricks Asset Bundle
 ※対象外
 - Terraformにない機能
 - Schema
 - 権限のバインディングはコード管理され ている

  15. Raven Table structure テーブル構成 
 - 現状我々でマート作成は実施して いない
 - Goldは現在なし


    - カラム単位での制御のため Dynamic Viewでグループごとの 制御を実施

  16. Raven Table structure テーブル構成 
 - 現状我々でマート作成は実施して いない
 - Goldは現在なし


    - カラム単位での制御のため Dynamic Viewでグループごとの 制御を実施
 
 ※Dynamic Viewはタイムトラベルを使 えないので一部silverを解放している