2026-06-11 Iceberg Trinoログ基盤の設計ポイント - Design Points for an Iceberg + Trino Log Platform

Iceberg Trinoログ基盤の設計ポイント 2026-06-11 Tadahisa Kamijo Apache Iceberg実践 ! ベストプラクティス
Meetup

自己紹介上條忠久 Kamijo Tadahisa • さくらインターネット株式会社サービス統括本部 • ソフトウェアエンジニアとしてサービス開発・運用
◦ Go, TypeScript, Python, Kotlin ◦ Linux, Nomad, Ansible, Prometheus, React • 今日は大阪から参加

ログ基盤概要 • 今まで社内各チームで監視基盤が個別に構築運用されている状況だった ◦ Prometheus, Elastic Stack, Loki, etc… ◦
社内向けログ基盤を提供することで、運用レベルの底上げ・運用コスト削減を目的 ◦ OSS運用なども行ったが、マルチテナント提供・ライセンス体系の問題 ◦ Trino+Icebergの構成で開発を開始 • 2023年からパブリックサービス化を目指して開発開始 ◦ アプリケーション・OS・ミドルウェアから出力される、システムログの保管場所として開発 ◦ Trino, Iceberg, 社内のオブジェクトストレージ等を組み合わせてスクラッチ開発 ◦ デジタル庁のガバメントクラウドの要件に含まれ、 2025年度末までの完成を目指していた

さくらのクラウドモニタリングスイート • ログ・トレースストレージ ◦ fluent-bit, OtelCollectorなどからシステムログ・トレースを受け取る ◦ データの保管・Web UIのクエリ画面を提供
• メトリクスストレージ ◦ Prometheus, OtelCollectorなどから、メトリクスを受け取る ◦ データの保管・Web UIのクエリ画面/クエリAPIを提供 • アラートプロジェクト ◦ ログ・メトリクスに対して、クエリ・しきい値を設定 ◦ アラートはメール・Slack等で受け取り可能 • さくらのクラウド連携 ◦ LB, コンテナ実行基盤等と連携し、ログ・メトリクスなどを設定のみで収集可能ログ・トレースストレージストレージは、IcebergとTrinoをベースに構築

ADR風に ADR • Architecture Decision Record アーキテクチャ決定記録 • 意思決定を短い文書で記録するモニタリングスイートの中で行った
アーキテクチャ意志決定をいくつか紹介します https://learn.microsoft.com/en-us/azure/well-architected/architect-role/architecture-decision-record

Icebergテーブル構造ログ・トレースはIcebergテーブルへ記録 • テナント毎にテーブルを分ける ◦ データ削除の容易さ ◦ 性能分離・メンテナンスの容易さ ◦ 暗号化の要求が有った際、顧客毎に異なる暗
号化キーを利用したい • 時間でパーティション・ソート ◦ 検索対象のファイルを減らす ◦ パーティション毎に課金メトリクスを取りたい • ネスト型(struct,list,map)を使わない ◦ Trino, ORM等のサポートを考えると使いにくいのでフラットな構造とする CREATE TABLE log_tenant_1234 ( timestamp TIMESTAMP(6), insert_id VARCHAR, labels MAP(VARCHAR, VARCHAR ), level VARCHAR, -- DEBUG, INFO, WARN, ERROR message VARCHAR ) WITH ( partitioning = ARRAY[ 'day(timestamp)' ], sorted_by = ARRAY[ 'timestamp' ] ); (実際は大量のフィールドが定義されています )

ログ基盤の構成 Write Client Ingester (Go) Committer (Kotlin) Object Storage REST
Catalog (MySQL) Query Gateway (Go) Maintainer (Go) OTLP/H TTP Publish Consume Write Iceberg Table Catalog Operations Issue Maintenance Command HTTP API Read Client HTTP API Loader (Kotlin) Publish Consume Parquet File Data File log rows

Catalog (MySQL) Query Gateway (Go) Maintainer (Go) OTLP/H TTP Publish Consume Write Iceberg Table Catalog Operations Issue Maintenance Command HTTP API Read Client HTTP API Loader (Kotlin) Publish Consume Parquet File Data File log rows 受け取ったログを一度Kafkaに入れる理由 • Icebergのコミットは基本的に同時にコミットできないため、基盤側でタイミングを調整するため • コミットは再試行が発生し数秒かかる可能性があるが、待たずにHTTP 200を返したい異なる言語が混在する理由 • OTLP等のSDKが提供されるのはGo • Icebergライブラリは基本的にJava 言語混在環境のため、赤枠部分は ProtocolBufferでやりとり

Catalog (MySQL) Query Gateway (Go) Maintainer (Go) OTLP/H TTP Publish Consume Write Iceberg Table Catalog Operations Issue Maintenance Command HTTP API Read Client HTTP API Loader (Kotlin) Publish Consume Parquet File Data File log rows 2つの独自コンポーネントでPublishする理由 • テナント(テーブル)によって書き込みレートが n桁単位で異なる • 行本体(Parquetファイル)の転送・テーブルへのコミットを分けることで、全体のスループットを安定させる詳しくは過去資料で→

Catalog (MySQL) Query Gateway (Go) Maintainer (Go) OTLP/H TTP Publish Consume Write Iceberg Table Catalog Operations Issue Maintenance Command HTTP API Read Client HTTP API Loader (Kotlin) Publish Consume Parquet File Data File log rows オンプレ環境のIcebergのメタ情報を保存する Catalogの選択肢は以下 • JDBC (PostgreSQL, MySQL, SQLite, etc) • REST Catalog REST Catalogを選択した理由 • RDBMSへの同時接続数の削減 • DDL発行の責任を明確にするため • バックエンドにTiDBを使っており、SQLをカスタムする必要が出る可能性 Lakekeeper(Rust製)は？ • ベンチマークで3割程度性能劣化が見られたためREST Catalogの利用を継続

Catalog (MySQL) Query Gateway (Go) Maintainer (Go) OTLP/H TTP Publish Consume Write Iceberg Table Catalog Operations Issue Maintenance Command HTTP API Read Client HTTP API Loader (Kotlin) Publish Consume Parquet File Data File log rows IcebergテーブルへのクエリはTrinoを利用 • 複数ノードに渡るスケジューリング • オンプレでも構築管理が容易 Icebergのテーブルメンテナンスは独自コンポーネントから実行 • Spark基盤等が無い • TrinoのSQLでメンテナンスを行う事で、実装コストの削減・クエリとのリソース共有が可能 • ユーザクエリの優先度を上げている

TrinoGateway 複数のTrinoクラスタを構築し、Trino Gatewayで HA構成を作る • Trinoは基本的に単体では HA構成不可 • Trino Gatewayはクエリ毎に同時実行数など
を参考に、複数のクラスタにクエリを割り振ることが出来る • Trino Gateway自体はRDBに繋がっているステートレスアプリなので、スケール・ HA化が容易 https://trinodb.github.io/trino-gateway/

バッチサイズの調整ログをIcebergテーブルに書き込むまでの時間の調整待機時間3秒→10秒にした所非常に大きな効果が出た • オブジェクトストレージのアクセス 4割減 • Table最適化の実行時間
半分ユーザがデータを見れるようになるまでのラグは増えるので、サービス性質を見ながら調整メモリに一時的に貯める容量も増える・ Kafka等と併用する場合は、パーティション等のデザインが強く影響する

Iceberg Trinoログ基盤の設計ポイント • テーブルでテナント分離 • 日付ベースでのパーティション・時間でのソート • マイクロサービス構成 ◦ KafkaでMQ
◦ 2段書き込み構成でスループット向上 ◦ REST Catalog(BackendはTiDB) ◦ Trinoでクエリ・テーブル最適化 • TrinoGatewayでのTrinoクラスタHA化 • バッチサイズを適切なサイズに設定

2026-06-11 Iceberg Trinoログ基盤の設計ポイント - Design P...

2026-06-11 Iceberg Trinoログ基盤の設計ポイント - Design Points for an Iceberg + Trino Log Platform

kamijin_fanta

More Decks by kamijin_fanta

Other Decks in Programming

Featured

Transcript

Iceberg Trinoログ基盤の設計ポイント 2026-06-11 Tadahisa Kamijo Apache Iceberg実践 ! ベストプラクティス

自己紹介上條忠久 Kamijo Tadahisa • さくらインターネット株式会社サービス統括本部 • ソフトウェアエンジニアとしてサービス開発・運用

ログ基盤概要 • 今まで社内各チームで監視基盤が個別に構築運用されている状況だった ◦ Prometheus, Elastic Stack, Loki, etc… ◦

さくらのクラウドモニタリングスイート • ログ・トレースストレージ ◦ fluent-bit, OtelCollectorなどからシステムログ・トレースを受け取る ◦ データの保管・Web UIのクエリ画面を提供

ADR風に ADR • Architecture Decision Record アーキテクチャ決定記録 • 意思決定を短い文書で記録するモニタリングスイートの中で行った

Icebergテーブル構造ログ・トレースはIcebergテーブルへ記録 • テナント毎にテーブルを分ける ◦ データ削除の容易さ ◦ 性能分離・メンテナンスの容易さ ◦ 暗号化の要求が有った際、顧客毎に異なる暗

ログ基盤の構成 Write Client Ingester (Go) Committer (Kotlin) Object Storage REST

ログ基盤の構成 Write Client Ingester (Go) Committer (Kotlin) Object Storage REST

ログ基盤の構成 Write Client Ingester (Go) Committer (Kotlin) Object Storage REST

ログ基盤の構成 Write Client Ingester (Go) Committer (Kotlin) Object Storage REST

ログ基盤の構成 Write Client Ingester (Go) Committer (Kotlin) Object Storage REST

TrinoGateway 複数のTrinoクラスタを構築し、Trino Gatewayで HA構成を作る • Trinoは基本的に単体では HA構成不可 • Trino Gatewayはクエリ毎に同時実行数など

バッチサイズの調整ログをIcebergテーブルに書き込むまでの時間の調整待機時間3秒→10秒にした所非常に大きな効果が出た • オブジェクトストレージのアクセス 4割減 • Table最適化の実行時間

Iceberg Trinoログ基盤の設計ポイント • テーブルでテナント分離 • 日付ベースでのパーティション・時間でのソート • マイクロサービス構成 ◦ KafkaでMQ

2026-06-11 Iceberg Trinoログ基盤の 設計ポイント - Design P...

2026-06-11 Iceberg Trinoログ基盤の 設計ポイント - Design Points for an Iceberg + Trino Log Platform

More Decks by kamijin_fanta

Other Decks in Programming

Featured

Transcript

2026-06-11 Iceberg Trinoログ基盤の設計ポイント - Design P...

2026-06-11 Iceberg Trinoログ基盤の設計ポイント - Design Points for an Iceberg + Trino Log Platform