Slide 5
Slide 5 text
Apache Iceberg overview
● ストレージフォーマット
○ ビッグデータ・データレイク構築
○ 仕様とデータを読み書きする低レイヤーライブラリ (Java,Python)の提供
○ クエリエンジンTrino, Presto, Spark, Hive, Flink, Impala, 他から同じデータを参照
● Netflix→Apache Software Foundation
● 機能
○ 高い信頼性: Seriallizable isolation, Snapshot, Atomic mutation
○ 費用対効果の高いストレージ : Object Storage, Parquet
○ パフォーマンス最適化 : Partitioning, Clustering, CoW/MoR切り替え
○ スキーマ変更: Schema Evolution, Table, Partitioning