Slide 19
Slide 19 text
データ品質 (Data Quality) における取り組み
適時性の定義と保守
データが日々の業務での意思決定に利用されることが多かった。
その時点で利用しているデータが、いつ時点のデータを示すかが大事な指標とな
るため、適時性を最初に保守対象に選定した。
正確に測ると、1つの行データごとに
(ユーザーにデータが届いた時刻 - データが生成された時刻)
を比較して計測を行うことになる。
工数軽くするために、BigQueryの最終更新日時メタデータと現在時刻を比較する
ことで、適時性の保守を試みた。
SLI, SLO, SLAを分析ユーザーと定義、公開し保守・改善を行った
適時性
元データが更新されてからどの
くらいの遅延で分析可能になる
か