Slide 41
Slide 41 text
©2023 Databricks Inc. — All rights reserved
大規模ETLは複雑かつ不安定なものです
Data Lake
CSV,
JSON, TXT…
Kinesis
BI &
Reporting
Streaming
Analytics
Data Science
& ML
貧弱な
データ品質
データ品質の監視、
強制が困難
データのリネージュを追
跡できない
パイプライン
オペレーションが困
難
詳細なデータレベルでの
貧弱な観察可能性
エラーハンドリングと リカ
バリが面倒
複雑な
パイプライン
の開発
依存性を構築、維持
することが困難
バッチとストリーム
処理を切り替えるのが
困難