Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tokyo dbt Meetup #10 dbt Cloudユーザー会 & パネルディスカッション

tokyo dbt
October 25, 2024

Tokyo dbt Meetup #10 dbt Cloudユーザー会 & パネルディスカッション

dbt Cloudの利用ケース、CI/CDの工夫、今後注目の機能に関して登壇者の方々といっしょにパネルディスカッションをしませんか?

株式会社タイミー、株式会社MonotaRO、and roots株式会社、Stable株式会社の方々にご登壇を頂きました。

tokyo dbt

October 25, 2024
Tweet

Other Decks in Technology

Transcript

  1. Agenda 1 コミュニティの紹介 19:00-19:05 PM 4 dbt Cloudの注目の機能 / 改善点は?

    20:05-20:35 PM パネルディスカッション 2 教えて! dbt Cloudの利便性と利点 19:05-19:35 PM パネルディスカッション 5 交流会 20:40-21:30 PM 3 CI/CDの工夫と運用上のベ スプラは? 19:35-20:05PM パネルディスカッション
  2. Whatʼs going on in the dbt Community? ◆ Upcoming events

    ◆ New dbt releases ◆ Company news ◆ Hot topics in the community
  3. dbt Cloud のどの機能が、日々の作業において最も役立っていると感じますか? Job scheduler 機能 dbt コマンドの実行を、Cron による定期実行や イベントトリガーで自動化できる。

    データチームはワークフローのためのインフラを 構築・保守する必要がなくなり、データ活用やデータコント ロールに専念できる。個人的には、データ文化の形成期 から利用することをオススメします。 https://cloud.getdbt.com/deploy/ACCOUNT_ID/projects/PROJECT_ID/jobs/JOB_ID 形成期 醸成期 成熟期 データ文化の形成期では、データの有用性が組織に根付いていな いため、データチームが率先してビジネス価値の創出を行い、デー タ活用の効果を示す必要がある。 dbt Cloud を活用したことで、形 成期において少ないエンジニアリングリソースでも、信頼性の高 いデータパイプラインを迅速に構築できた 。
  4. dbt Cloudを使用する前後で、作業効率や品質等にどのような変化がありましたか? (dbt-coreとの比較を中心に ...) - Gitに慣れてなくても何となく使い始められる - データアナリストの人に普及するなら便利 - dbt

    Cloudは、Artifactsの管理などを全部裏側で勝手 にやってくれるので、便利機能が最初から使える - CI/CDのパートで話します - ExploreやIDEで色んな情報が見れる! - PRに変更後のリネージの画像を貼って、 レビューしやすくしたりしている - dbt-power-userのリネージより見やすい - 直接データ品質向上に繋がる例はあまりないかも - 無駄なCI実装をやらなくて済むので、品質に時 間を割けるという、間接的な効果はある ▼dbt Cloud IDEのリネージ ▼dbt-power-userのリネージ
  5. CI/CDの導入において、どのような課題に直面しましたか? それをどう解決しましたか? “課題” • dbt cloud上では、権限がある人がjob, schedule設定を自由にできるため、人数 が増えてくると想定外の設定がされ、エラーや障害につながっていた • dbt

    cloud上のjob設定で、環境の設定が少し複雑であるため、ミスも起こりがち であった (target=prod, dev的なやつ) • どのjob, schedule設定が現在されているのか検索性もいまいちであった
  6. dbt Cloud を CI/CD に組み込む際に工夫しているポイントは何ですか? Webhooks でプチ拡張していること Webhookes を使用すると、dbt のジョブ実行状態を外部システムに通知

    できる。ジョブの開始、完了、失敗などのイベントが発生した際に、指定し たエンドポイントに HTTP リクエストを送信する。 https://cloud.getdbt.com/settings/accounts/ACCOUNT_ID/pages/webhooks ② BI ツール(Steep)のデータ更新 ① エラーの詳細を Slack に投稿
  7. ベストプラクティスとして推奨したい設定やフローはありますか? Slim CI 変更した モデル 下流の モデル 変更に 関係ない モデル

    変更に 関係ない モデル 下流の モデル 上流の モデル 実行される 実行される 実行される 実行されない 実行されない 実行されない Pull Request作成時に、変更のあったモデルのみを実 行してくれ、変更内容の確認が簡単にできる CI - これをdbt-coreでやろうとするとかなり大変 - Artifactsの管理が必須になる - dbt Cloudは、Artifactsの管理などを全部裏側 で勝手にやってくれるので簡単に実現できる - さらに、PRごとにデータベース・スキーマを自動 作成してくれるので、 PRごとの実行結果をレ ビュワーが確認しやすい
  8. ベストプラクティスとして推奨したい設定やフローはありますか? Merge Job Pull Requestマージ時に、 変更のあったモデルのみを実行してくれる - Slim CIと同様に、マージした PRで変更のあった

    モデルのみを実行してくれる - この機能が登場する前は、手動で実行したり、 翌日まで待ったりしていたが、何も考える必要 がなくなった PRマージ Merge Job DWH トリガー デプロイ
  9. dbt Cloudに興味がありますか? デモを予約 dbtのエキスパートと簡単な面談を行い、dbt Cloudがどのようにチームをサポートできるか評価します。その後、dbt Cloudの利点を最大限に活用する方法を紹介するライブデモをご覧いただけます。 開発をスピードアップ 自動化、モジュール化、再現性により、質 の高い分析を迅速に提供。 データ品質と信頼性の向上

    自動テスト、ドキュメント化、透明性によ り、ビジネス指標の信頼性を保証します。 チームの団結 PythonやSQLによる開発でボトルネックや サイロを排除し、アナリストやデータエン ジニアが協力してデータを変革できる環境 を整備します。