Slide 5
Slide 5 text
© NTT Communications Corporation All Rights Reserved. 5
Open Table Format (OTF)
• 分析データのファイルフォーマット
• Parquet, Avro, OCR, json
• 分析効率のため複数のファイルに分割して保存
• データカタログ機能はファイルとデータの関係を示すメタ
データを提供
• AWS: Glue Data Catalog
• OSS: Apache Iceberg, DeltaLake, Apache Hudi
• 2024年 Iceberg関連のアナウンスが多かった
• SnowflakeがPolaris Catalogを発表
• DatabricksがTabluar社(Icebergの開発元)を買収
• Amazon S3 TablesがIceberge Catalog機能を提供 ref: https://www.youtube.com/watch?v=1U7yX4HTLCI