Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データ品質を重視したデータ基盤プロダクト開発

 データ品質を重視したデータ基盤プロダクト開発

データ基盤アーキテクチャトレンド 2023 LTとパネルで学ぶ (https://findy.connpass.com/event/278140/)
の登壇資料になります。

Toshiki Tsuchikawa

April 11, 2023
Tweet

More Decks by Toshiki Tsuchikawa

Other Decks in Technology

Transcript

  1. 土川 稔生 (Tsuchikawa Toshiki) • 株式会社タイミーに2020年入社 • DRE (Data Reliability

    Engineering) チーム ◦ データエンジニアとしてデータ基盤プロダク トを構築 ◦ 現在はプロダクトオーナーとして、データ基 盤プロダクト作りに励む • Twitter: @tvtg_24 2 自己紹介
  2. 高品質なデータとは... データニーズA 経営に関する意思決定 • 前日分のデータを用いる • データにズレがあると意思決定を 間違い、大きな問題になる データニーズB 機械学習アルゴリズム

    • リアルタイムに近いデータを用いる • データに多少誤差があっても精度 には大きな影響がない データ基盤プ ロダクト ⭕ リアルタイム性 高 データの正確性 低 リアルタイム性 低 データの正確性 高
  3. 高品質なデータとは... データニーズA 経営に関する意思決定 • 前日分のデータを用いる • データにズレがあると意思決定を 間違い、大きな問題になる データニーズB 機械学習アルゴリズム

    • リアルタイムに近いデータを用いる • データに多少誤差があっても精度 には大きな影響がない データ基盤プ ロダクト ❌ リアルタイム性 高 データの正確性 高
  4. 14 Service Level Indicator サービスの品質を守るための指標 SLI SLA SLO Service Level

    Agreement SLIで定義した指標に関するサービス提供者と の契約 (破った時にどうするかなど) Service Level Objective SLIで定義した指標の具体的な目安 一般的なSLI, SLA, SLOの定義
  5. 15 Service Level Indicator データパイプラインの適時性 (データソースの更新からど のくらい遅れて転送先で実用可能になるか) SLI SLA SLO

    Service Level Agreement データソースごとにデータ使用者と結ばれた適時性 に関する契約 破った場合はポストモーテムを実施 例: データソースAは1日の適時性での転送 Service Level Objective DREチーム内で決定されたデータソースごとの適 時性の目標 例: データソースAは2hourの適時性での転送 DREチームにおけるSLI, SLA, SLOの定義