Slide 1

Slide 1 text

JEDAI データエンジニア分科会 #1 集まれデータエンジニア! 誰も教えてくれない メダリオンアーキテクチャの デザインメソッド manabian

Slide 2

Slide 2 text

自己紹介 @manabian 【主な生業】 BI・DWH構築に関するSIベンダーにてテクニカルスペシャリスト職と して、次の業務を実施。 • Databricks におけるシステム実装論の整理とライブラリ開発 • データ分析基盤とアプリケーションの設計・構築に関する支援 • データ分析基盤に関する技術検証 趣味がデータ分析基盤に関する調査や検証であり、 主に Qiita を中心に Databricks などのデータ分析基盤に関する記事を 投稿。 • 最強のデータ分析基盤を目指して~汎用的なデータ分析基盤の選定 方法の提案~ – Qiita • PySpark 開発時に知っておくべき7つのテーマ– Qiita • データエンジニア界隈で話題のdbt(data build tool)のまとめ #Python - Qiita

Slide 3

Slide 3 text

はじめに メダリオンアーキテクチャの実装方法論 プログラムの共通化による開発生産性向上 データ分析基盤における データを どのように管理するか

Slide 4

Slide 4 text

アジェンダ

Slide 5

Slide 5 text

1. 前提となる事項の確認 1-1. データ分析基盤とは 実際に利用できるコンポーネント 引用元:最強のデータ分析基盤を目指して~汎用的なデータ分析基盤の選定方法の提案~ - Qiita

Slide 6

Slide 6 text

1. 前提となる事項の確認 1-2. メダリオンアーキテクチャとは 具体的な実装例がないため解釈に幅 引用元:メダリオンアーキテクチャ | Databricks

Slide 7

Slide 7 text

2. メダリオンアーキテクチャの実装方法 2-1. 全体像 引用元:Databricks ( Spark ) における Spark テーブル (データレイク)のディレクトリ構成の検討 - Qiita

Slide 8

Slide 8 text

2. メダリオンアーキテクチャの実装方法 2-2. Bronzeレイヤーついて(1/2)

Slide 9

Slide 9 text

2. メダリオンアーキテクチャの実装方法 2-2. Bronzeレイヤーついて(2/2)

Slide 10

Slide 10 text

2. メダリオンアーキテクチャの実装方法 2-3. Silver レイヤーついて 引用元:Bronze テーブルから Silver テーブルへのデータローディングパ ターン - Qiita

Slide 11

Slide 11 text

2. メダリオンアーキテクチャの実装方法 2-4. Goldレイヤーついて

Slide 12

Slide 12 text

2. メダリオンアーキテクチャの実装方法 2-5. Otherレイヤーついて

Slide 13

Slide 13 text

2. メダリオンアーキテクチャの実装方法 2-6. 全体像の振り返り

Slide 14

Slide 14 text

2. メダリオンアーキテクチャの実装方法 2-7. データ品質保証の実施

Slide 15

Slide 15 text

3. データエンジニアリングの実施方法 3-1. オーケストレーションの設計方針

Slide 16

Slide 16 text

3. データエンジニアリングの実施方法 3-2. Databricks におけるアクティビティ

Slide 17

Slide 17 text

ありがとうございました 参考になった記事には いいねをお願いします manabian 𝕏: @manabian Qiita: manabian