on AWSとしてApache Iceberg自体はサポートされていまし た。 ◼データカタログとしてAWS Glue Data Catalogを使用することができます。 ◼使用するためにはApache Iceberg on AWSのベストプラクティスを理解する ことが求められます。 ◼運用・保守にそこそこ稼働がかかります。 https://docs.aws.amazon.com/ja_jp/prescriptive-guidance/latest/apache-iceberg-on-aws/introduction.html
Name Age 1 Bob Jones 55 2 Susie Mills 35 3 Grace Gregory 45 File003.parquet Snapshot 05 Snapshot 06 ID Name Age 1 Bob Jones 55 2 Susie Mills 35 3 Grace Gregory 46 File008.parquet O’REILLY Apache Iceberg The Definitive Gudeの図を流用 File rewritten UPDATE catalog.people SET age = 46 WHERE id = 3; 新しいdata file「File008.parquet」を作成する
Name Age 1 Bob Jones 55 2 Susie Mills 35 3 Grace Gregory 45 File003.parquet Snapshot 05 Snapshot 06 ID Name Age 1 Bob Jones 55 2 Susie Mills 35 3 Grace Gregory 45 File003.parquet O’REILLY Apache Iceberg The Definitive Gudeの図を流用 File not rewritten File Position File003 3 Delete001.avro File008.parquet ID Name Age 3 Grace Gregory 46 Delete file and new datafile written UPDATE catalog.people SET age = 46 WHERE id = 3; 差分のmanifest file「Delete001.avro」、 data fileを「File008.parquet」作成する