Upgrade to Pro — share decks privately, control downloads, hide ads and more …

dbtの概要

Shasha
June 09, 2022

 dbtの概要

Shasha

June 09, 2022
Tweet

More Decks by Shasha

Other Decks in Technology

Transcript

  1. 4 ETLの時代(2010年代)
 • ETL
 ◦ Extract(抽出) ◦ Transform(変換) ◦ Load(ロード)

    • データ分析界隈の関心
 ◦ ETLをどのように構築するか ◦ どのようにスケールさせるか ◦ ストレージのコストを抑える ◦ DWHのパフォーマンスをあげる方法 
 DWH ETL Data Source
  2. 5 ETLの時代(2010年代)
 • データ分析界隈の関心
 ◦ ETLをどのように構築するか ◦ どのようにスケールさせるか ◦ ストレージのコストを抑える

    ◦ DWHのパフォーマンスをあげる方法 
 
 DWH ETL Data Source こんなことをするために データアナリストになったのではな い!!
  3. 11 T(変換)の重要性
 
 
 
 
 
 
 • データ型のクリーニング


    • 複数のシステムのデータを統合
 • データのフィルタリング
 • 論理削除されているデータの除外
 • キレイなデータをそれぞれ結合

  4. 13 dbtが提供するこれからのデータモデリング
 ・SELECT文を知っていれば、誰でもデータマート開発を行えるサービス
 ・特別な知識&スキル不要で、アプリ開発の手法を取り入れた開発が可能
  (バージョン管理、CI/CD、自動テスト、ドキュメント管理、etc)
 アプリ開発の手法を取り入れている ・Gitと連携 ・継続的インテグレーション ドキュメントの自動生成 ・データの定義や依存関係等がわかる

    ・データカタログの役割も Jinjaで高度な処理を開発できる ・SQLだけでは実現できない処理の実現 ・マクロとして処理をモジュール化、再利用可 データに対してテストを実行できる ・not nullや参照整合性等を自動でテスト可能 ・Jinjaで、オリジナルのテストも作成可能 主要なDWHに対応 ・Amazon Redshift、Snowflake、Google BigQuery SQLで開発できる ・必要なのはSELECT文だけ ・プログラミング言語の学習は不要 1 6 5 3 4 2
  5. 15