Slide 13
Slide 13 text
©2024 Databricks Inc. — All rights reserved
データリネージュは自動で可視化
13
いつも通りのコードやクエリでデータ加工をするだけで、自動的に可視化
このテーブルはどんなデータから作られているのか?
このカラムはどこから来ているか?
このデータを使用している後続のデータは?
CREATE TABLE silver AS
SELECT
. . .
FROM bronze_a
JOIN bronze_b
. . .
リネージュ情報を同期するための 事前セットアップ等は一切不要で 、
通常通りSQLやPythonのコードでデータ加工を行うと、自動でリネージュグラフが可視化
spark.read
.table(silver)
.withColumn(“new”, xxxx)
. . .
.write
.saveAsTable(“gold”)
自動で実行ログ解析、
リネージュグラフ構築
データリネージュ