Slide 6
Slide 6 text
6
データ品質の指標
代表的なもの
6
完全性 Integrity
レコードは欠損していないか?
Requiredなカラムに値があるか?
これがないと…?
- 許容値を超えたら、データは「ス
トアするのに金がかかるゴミ」に
なる
一貫性 Consistency
ある値が…
データセット間で一貫しているか?
データセット内で一貫しているか?
これがないと…?
- レポートAとレポートBで同じ指
標値が異なる値になったりする
一意性 Uniqueness
重複してはいけないレコードやインスタ
ンスが重複していないか?
重複排除とほぼ同じ。
これがないと…?
- 極端な話、KPIが不正に二倍に
なったりする。
はじめに / Data Reliabilityとは?