Slide 19
Slide 19 text
Confidential © CREATIVE SURVEY
dbt testでやったこと
- RDSデータのsnapshotとmodelの類似度を測るカスタムGenericテストの作成
> Snowflakeの関数 MinhashとAPPROXIMATE_SIMILARITYを利⽤
- サンプルコードや内部的な動作は参考記事を参照
- Minhashで作成するハッシュ関数の数など、関数のパラメータはドキュメントの推奨値をそ
のまま使⽤
- Generic tests(汎⽤テスト)の適⽤
> modelなどのリソースにテストを設定するyml(プロパティ)に書きこんでいく
> 始めから⽤意されているGenericテストがある
- unique, not_null, accepted_values, relationships
「参考:Snowflake Document 『2つ以上のセットの類似性の推定』」