Upgrade to Pro — share decks privately, control downloads, hide ads and more …

dbtの概要

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Shasha Shasha
June 09, 2022

 dbtの概要

Avatar for Shasha

Shasha

June 09, 2022
Tweet

More Decks by Shasha

Other Decks in Technology

Transcript

  1. 4 ETLの時代(2010年代)
 • ETL
 ◦ Extract(抽出) ◦ Transform(変換) ◦ Load(ロード)

    • データ分析界隈の関心
 ◦ ETLをどのように構築するか ◦ どのようにスケールさせるか ◦ ストレージのコストを抑える ◦ DWHのパフォーマンスをあげる方法 
 DWH ETL Data Source
  2. 5 ETLの時代(2010年代)
 • データ分析界隈の関心
 ◦ ETLをどのように構築するか ◦ どのようにスケールさせるか ◦ ストレージのコストを抑える

    ◦ DWHのパフォーマンスをあげる方法 
 
 DWH ETL Data Source こんなことをするために データアナリストになったのではな い!!
  3. 11 T(変換)の重要性
 
 
 
 
 
 
 • データ型のクリーニング


    • 複数のシステムのデータを統合
 • データのフィルタリング
 • 論理削除されているデータの除外
 • キレイなデータをそれぞれ結合

  4. 13 dbtが提供するこれからのデータモデリング
 ・SELECT文を知っていれば、誰でもデータマート開発を行えるサービス
 ・特別な知識&スキル不要で、アプリ開発の手法を取り入れた開発が可能
  (バージョン管理、CI/CD、自動テスト、ドキュメント管理、etc)
 アプリ開発の手法を取り入れている ・Gitと連携 ・継続的インテグレーション ドキュメントの自動生成 ・データの定義や依存関係等がわかる

    ・データカタログの役割も Jinjaで高度な処理を開発できる ・SQLだけでは実現できない処理の実現 ・マクロとして処理をモジュール化、再利用可 データに対してテストを実行できる ・not nullや参照整合性等を自動でテスト可能 ・Jinjaで、オリジナルのテストも作成可能 主要なDWHに対応 ・Amazon Redshift、Snowflake、Google BigQuery SQLで開発できる ・必要なのはSELECT文だけ ・プログラミング言語の学習は不要 1 6 5 3 4 2
  5. 15