Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

DataOps実現への道筋 持続可能な運用体制の構築 / journey-to-dataops

pei0804
July 29, 2024

DataOps実現への道筋 持続可能な運用体制の構築 / journey-to-dataops

データ利活用のミソ DataOps実現のための取り組みとは? Lunch LT
https://findy.connpass.com/event/323727/

pei0804

July 29, 2024
Tweet

More Decks by pei0804

Other Decks in Technology

Transcript

  1. 効果的だった5つの施策 1. ツールの導入 2. データオーナーの確立 3. Slackチャンネルの再設計 4. データ品質向上 5.

    Playbookの整備 実際のDataOpsの推進施策は、この順番で進めました。 なぜこの順番なのかは、それぞれのセクションで説明します。
  2. 実際に行ったSlackチャンネルの再設計 • 基盤チーム向け(#info, #warning, #error, #emegency) ◦ 目的 ▪ システム全体の把握を素早くできる。

    ◦ 効果 ▪ 基盤チームに特化した作りにできるようになった。 • 役割が曖昧な時はオーナーへのノイズを気にしていた。 • データオーナー向け(#data_monitoring) ◦ 目的 ▪ モデル関連問題を一元管理。 ◦ 効果 ▪ ここだけ見ればいい状態になり、情報の取捨選択が簡素化。 ▪ チーム間のナレッジシェア。
  3. 基本的なデータ整合性の検証 dbt generic data test dbtのgeneric data testは基本的なデータ品質保証の要です。 特にビジネスキーに対するuniqueとnot_nullテストは必須であり、 これだけでも多くのデータ問題(ファントラップ等)を防げます。

    弊社だと、全カラムへの網羅的なテスト適用はコスト効率が悪いため、 ビジネス上クリティカルな部分に焦点を当てるようにしています。 ※事業特性に応じて適切に判断しましょう。