Slide 1

Slide 1 text

リアルタイム分析データベースで実現する SQLベースのオブザーバビリティ Feb 13, 2025 松本 幹 Senior Support Engineer

Slide 2

Slide 2 text

About me ● ClickHouseの日本人社員第1号 ● SREやプロフェッショナルサービスを中心に活動 ● 大規模データを扱うシステム導入支援や技術サポート (ClickHouse, Elastic, Domo)

Slide 3

Slide 3 text

アジェンダ 歴史的な背景 01 ClickHouseとは 02 ユースケース 03 3 柔軟なスキーマへの対応 04

Slide 4

Slide 4 text

01. 歴史的な背景

Slide 5

Slide 5 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 5 SQLは50年以上前に開発されたが、依然として人気 https://survey.stackoverflow.co/2024/technology#most-popular-technologies-language-prof 2024年のStackOverflowの 開発者向け調査結果によると、 SQLが2番目に人気のあるプログ ラミング言語にランクイン。 調査対象となった67,000人 以上のプロの開発者のうち、 半数以上が使用していると回答

Slide 6

Slide 6 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 6 リアルタイム分析データベースの進化

Slide 7

Slide 7 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 7 同時に、DevOps におけるオブザーバビリティも進化

Slide 8

Slide 8 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 8 SQLとオブザーバビリティの統合

Slide 9

Slide 9 text

“オブザーバビリティは、 単なる大量データの問題 であるˮ

Slide 10

Slide 10 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 10 オブザーバビリティのアーキテクチャ コレクション ストレージ 可視化/アラート

Slide 11

Slide 11 text

02. ClickHouse とは

Slide 12

Slide 12 text

ClickHouse とは? オープンソース 列指向 分散 OLAPデータベース レプリケーション シャーディング マルチマスター クロスリージョン 2009年から開発開始 2016年にオープンソース化 38,000 GitHubスター 1,300 コントリビューター 500 リリース 集計に最適 カラムごとのファイル管理 ソートとインデックス バックグラウンドマージ 分析ユースケース 集計処理 データの可視化 ほぼイミュータブルなデータ

Slide 13

Slide 13 text

2023 6月 ClickHouse Cloudが GCP上で一般提供開始 2022 12月 ClickHouse Cloudが AWS上で一般提供開始 2021 10月 シリーズB資金調達 ラウンドで、 250Mドルを 調達 2021 9月 シリーズA資金調達ラウンドで、 50Mドルを調達 正式にサービスを公開 2021 8月 ClickHouse, Inc. をアメリカで設立 2009 ClickHouseの プロトタイプを開発 2016 6月 ClickHouseを Apache 2.0ライセンスの 下で公開 100 リリース 2024 4月 ClickHouse Cloudが AWSの東京リージョンを サポート開始 2024 6月 ClickHouse Cloudが Azure上で一般提供開 始 ClickHouse の歴史

Slide 14

Slide 14 text

✓ 38k以上のGitHubスター ✓ 6.4k以上のフォーク ✓ 1.3k以上のコントリビュータ ✓ 100k以上のコミット ✓ 114k のアクティブなコミュニティメンバー Cloud ✓ 高速、スケーラブル、そして信頼性が高い ✓ 柔軟で機能が豊富、かつ使いやすい ✓ 毎日数十億のクエリを処理 ClickHouse オープンソース ClickHouse Cloud

Slide 15

Slide 15 text

Cloud セルフマネージド セルフマネージドにおけるアーキテクチャのサンプル ClickHouse Cloud architecture ✓ オープンソース ✓ 柔軟なアーキテクチャ ✓ 効率的で堅牢 ✓ サポート契約が利用可能 ✓ 使いやすい ✓ 機能が豊富 ✓ 高速 ✓ スケーラブル ✓ 信頼性が高い ✓ PAYG マネージド型サービス クラウドファースト機能とツールを提供 自動的にパフォーマンスと効率を最適化 シームレスなスケーリング 高い信頼性を保証 利用量と容量に応じた料金設定

Slide 16

Slide 16 text

リアルタイム分析 大規模データのリアルタイム分析・集計が可能なイ ンタラクティブなアプリケーションとダッシュボードを 実現。社内の複雑な分析処理も、分や時間単位で はなく、ミリ秒単位での実行を実現。 ビジネスインテリジェンス データを自在に分析し、分析レポートや社内アプリ ケーションの構築に活用。ユーザー行動分析、広告 ・メディア効果測定、市場動向分析など、幅広い用 途に対応。 機械学習と生成 AI 高速かつ効率的なベクトル検索を実現。様々なプ ロバイダーの生成 AIモデルをすぐに利用可能。ペ タバイト規模のモデルトレーニングも、超高速な集 計処理で実現。 ログ、イベント、トレース ログ、イベント、トレースの確実な監視 を実現。異常検知や不正検知、ネット ワーク・インフラの問題など、様々な課 題を検出可能。 ユースケース

Slide 17

Slide 17 text

03. ユースケース

Slide 18

Slide 18 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 18 ログ分析プラットフォーム アーキテクチャ  Log shippers → Kafka → ClickHouse → Kibana  LuceneクエリをSQLクエリに変換するQueryBridgeを  開発し、Kibanaを使用 メリット  高速なデータ取り込み  コスト管理 トレードオフ  スタックの管理、UIの開発 https://www.uber.com/blog/logging/ https://presentations.clickhouse.com/meetup40/uber.pdf

Slide 19

Slide 19 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 19 アーキテクチャの概要

Slide 20

Slide 20 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 20 オブザーバビリティのドッグフーディング アーキテクチャ  OpenTelemetry → ClickHouse → Grafana メリット  ログデータを詳細に、長期間にわたって保持可能  Datadog のコスト削減 トレードオフ  構築、保守に1.5人分の労力 https://clickhouse.com/blog/building-a-logging-platform-with-clickhouse-and-saving-millions-ov er-datadog

Slide 21

Slide 21 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 21 オブザーバビリティのドッグフーディング

Slide 22

Slide 22 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 22 約200倍の価格比 : ClickHouse vs Datadog

Slide 23

Slide 23 text

No content

Slide 24

Slide 24 text

04. 柔軟なスキーマへの対応

Slide 25

Slide 25 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 25 柔軟なスキーマの必要性 多くのシステム、特にマイクロサービスアーキテクチャでは、 はじめからデータが可変であることが前提にになっている。 ● 多様なマイクロサービス → 出力フォーマットが統一されない ● 新機能リリース → ログ項目の追加・削除がたびたび発生 ● 環境やバージョン違い → 出力形式が異なりやすい 引用: https://github.com/aelkz/microservices-observability

Slide 26

Slide 26 text

“JSON タイプを ネイティブ でサポート ˮ

Slide 27

Slide 27 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 27 JSONを新しくネイティブにサポート インサートする JSONデータ

Slide 28

Slide 28 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 28 動的に変化するデータへの対応

Slide 29

Slide 29 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 29 10億ドキュメント JSONチャレンジ 半構造化された JSON ドキュメントの大規模なデータセットをどれだけ 効率的に保存し、集計できるかを測定する。 # TABLE DDL CREATE TABLE bluesky ( `data` JSON kind LowCardinality(String), commit.operation LowCardinality(String), commit.collection LowCardinality(String), did String, time_us UInt64 ) ) ORDER BY ( data.kind, data.commit.operation, data.commit.collection, data.did, fromUnixTimestamp64Micro(data.time_us) ); # データセットのサンプル { "account": { "active": true, "did": "did:plc:kjealuouxn3l6v4byxh2fhff", "seq": "706717212", "time": "20241127T180002.429Z" }, "did": "did:plc:kjealuouxn3l6v4byxh2fhff", "kind": "account", "time_us": "1732730402720719" }

Slide 30

Slide 30 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 30 パフォーマンスの比較

Slide 31

Slide 31 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 31 クエリの集計パフォーマンス – Query1 SELECT data.commit.collection AS event, count() AS count FROM bluesky GROUP BY event ORDER BY count DESC;

Slide 32

Slide 32 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 32 クエリの集計パフォーマンス

Slide 33

Slide 33 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 33 まとめ ● リアルタイムOLAPとオープンソースによる標準化により SQLベースのオブザーバビリティが登場した ● 高いコストパフォーマンスを誇るため、多くの注目を集めている ● JSONのネイティブサポートにより、 スキーマに依存しない柔軟なデータモデルに対応している

Slide 34

Slide 34 text

©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 34 ClickHouse Cloud ですぐに検証できます

Slide 35

Slide 35 text

Thanks