Slide 7
Slide 7 text
Icebergは何が嬉しいか?
SQLを用いてS3上のデータの追加、更新、削除が行える
● INSERT, MERGE, DELETEが使える
● データソースの変更の差分を継続的にデータレイクに取り込むことも可能
● 一方でS3にあるファイルを直接触らなくて良い
そのためStepFunctionsでAthenaのクエリを定期的に実行するだけで
データ変換が可能になる。
Redshiftの導入も視野に入れていたが、Icebergをデータレイクに導入した。
DynamoDBからSageMaker Lakehouse(Icebergテーブル)へのZeroETL
も可能になっており導入に向けて検証中