Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Four KeysによるDataOps改善の第一歩

Masahiro ISHII
October 06, 2023
1.1k

Four KeysによるDataOps改善の第一歩

【Timee × NewsPicks共同開催】【オンライン開催】Four Keysで改善する開発生産性〜データ・モバイル・フロントエンド〜 - UB Tech Vol.12(https://uzabase-tech.connpass.com/event/294494/) 登壇資料です

Masahiro ISHII

October 06, 2023
Tweet

Transcript

  1. 現在のデータ基盤概要 ・・・ 収集 活用 営業 施策 KPI 可視化 KPI 可視化

    KPI 可視化 マーケ施 策 KPI 可視化 レコメン デーショ ン
  2. タイミーのDataOps ・・・ 収集 活用 営業 施策 KPI 可視化 KPI 可視化

    KPI 可視化 マーケ施 策 KPI 可視化 レコメン デーショ ン 究極的にはこの全体を DataOpsの生産性として捉えたい
  3. 例: 新しいデータを使って施策を回したい場合 ・・・ 収集 活用 営業 施策 KPI 可視化 KPI

    可視化 KPI 可視化 マーケ施 策 KPI 可視化 レコメン デーショ ン 新しい データ 新しい 施策
  4. 補足: データ基盤(ELT)の概念図 データ ソース Extract Transform Load データの抽出 データの 取り込み

    変換処理 DataLake 生データ 置き場 Staging 形式の統一や 個人情報の処 理等 DataWare House Dimensional Modeling後の データ DataMart ※ Transform内の層の設計は弊社の場合です Lookerや各種 ダッシュボード 等それぞれに 特化したデー タ 新しい 施策
  5. 施策実行時のチームと守備範囲 データ ソース Extract / Load DataLake Staging DataWareHouse DataMart

    DataEngineer (DRE) Analytics User ※ MLいれるとややこしくなりそうなので割愛します (実際に存在します) また、厳密ではないのでやることによって若干変わります 各システム保 持チーム Transform 新しい 施策
  6. 施策実行時のチームと守備範囲 データ ソース Extract / Load DataLake Staging DataWareHouse DataMart

    DataEngineer (DRE) Analytics User ※ MLいれるとややこしくなりそうなので割愛します (実際に存在します) また、厳密ではないのでやることによって若干変わります 各システム保 持チーム Transform 体感的に課題が多そうな、まずは DREと一部 Analyticsの領域を計測していく
  7. データ基盤開発のプロセスイメージ ストーリーの 作成 外部依頼・ ニーズ リファイン メント 開発チーム アサイン PR

    デプロイ レビュー 価値の創出 開発が終わるまで 繰り返す fourkeysのリードタイムの範囲 チームのストーリーをこなすリードタイム
  8. 個別に問題を追い込む必要がある https://cloud.google.com/blog/ja/products/gcp/using-the-four-keys-to-measure-your-devops-performance より引用 ① あるリポジトリだけリードタイムが異様に遅い (5,6日)から改善しないと! 確認すると、兼任者のみで構成されたチームが主に作業していたリポジトリであり、ヒアリング の結果、他の業務の手が空いたときのみの対応になっていることがわかった → 組織としての問題は把握できたが、即効性のある対応は難しそう

    ② そもそもどうやればリードタイム短くできるんだっけ? 変更行数が短くても必ずすぐにマージされるとは 限らないが、長くて早くマージされるものは なかった → 基本的に抑える形で PR作っていこうという   コンセンサスを得られた 一定以上行数が多くてリードタイム 1日以内は存在して いなかった※
  9. データ基盤における安定性の今後 データ ソース Extract Trans form Load ここまでが正しいこと を前提条件として 結果

    テーブル 最終的なデータ品質 が悪化しないことを 担保 このあたりの変更によって