Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ClickHouse {Cloud} アップデート
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Miki Matsumoto
March 12, 2025
64
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ClickHouse {Cloud} アップデート
Miki Matsumoto
March 12, 2025
More Decks by Miki Matsumoto
See All by Miki Matsumoto
なぜAI時代データ基盤に ClickHouse が選れるか
mikimatsumoto
0
79
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
470
オブザーバビリティとエージェント型AI - データ探索から答えへ -
mikimatsumoto
0
38
リアルタイムKPI分析のためのClickHouseとAIエージェント
mikimatsumoto
0
75
私のお気に入りの ClickHouse 最新機能
mikimatsumoto
0
59
MCPで強化する ClickHouseの業務改善
mikimatsumoto
0
140
リアルタイム分析で強化する AIエージェント
mikimatsumoto
0
55
なぜオブザーバビリティに ClickHouse なか?
mikimatsumoto
0
75
ClickHouse + Kafka 連携
mikimatsumoto
0
57
Featured
See All Featured
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
How to make the Groovebox
asonas
2
2.2k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.2k
The World Runs on Bad Software
bkeepers
PRO
72
12k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
840
Faster Mobile Websites
deanohume
310
31k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Marketing to machines
jonoalderson
1
5.4k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
550
Transcript
ClickHouse Cloud アップデート Miki Matsumoto March 2025
アジェンダ ClickHouseとは 01 ClickHouseのアップデート 02 ClickHouse Cloudのアップデート 03 2
01. ClickHouse とは
ClickHouse とは? オープンソース 列指向 分散 OLAPデータベース レプリケーション シャーディング マルチマスター クロスリージョン
2009年から開発開始 2016年にオープンソース化 36,000 GitHubスター 1,300 コントリビューター 500 リリース 集計に最適 カラムごとのファイル管理 ソートとインデックス バックグラウンドマージ 分析ユースケース 集計処理 データの可視化 ほぼイミュータブルなデータ
2023 6月 ClickHouse Cloudが GCP上で一般提供開始 2022 12月 ClickHouse Cloudが AWS上で一般提供開始
2021 10月 シリーズB資金調達 ラウンドで、 250Mドルを 調達 2021 9月 シリーズA資金調達ラウンドで、 50Mドルを調達 正式にサービスを公開 2021 8月 ClickHouse, Inc. をアメリカで設立 2009 ClickHouseの プロトタイプを開発 2016 6月 ClickHouseを Apache 2.0ライセンスの 下で公開 100 リリース 2024 4月 ClickHouse Cloudが AWSの東京リージョンを サポート開始 2024 6月 ClickHouse Cloudが Azure上で一般提供開 始 ClickHouse の歴史
✓ 36k以上のGitHubスター ✓ 6.4k以上のフォーク ✓ 1.3k以上のコントリビュータ ✓ 100k以上のコミット ✓ 114k
のアクティブなコミュニティメンバー Cloud ✓ 高速、スケーラブル、そして信頼性が高い ✓ 柔軟で機能が豊富、かつ使いやすい ✓ 毎日数十億のクエリを処理 ClickHouse オープンソース ClickHouse Cloud
Cloud セルフマネージド セルフマネージドにおけるアーキテクチャのサンプル ClickHouse Cloud architecture ✓ オープンソース ✓ 柔軟なアーキテクチャ
✓ 効率的で堅牢 ✓ サポート契約が利用可能 ✓ 使いやすい ✓ 機能が豊富 ✓ 高速 ✓ スケーラブル ✓ 信頼性が高い ✓ PAYG マネージド型サービス クラウドファースト機能とツールを提供 自動的にパフォーマンスと効率を最適化 シームレスなスケーリング 高い信頼性を保証 利用量と容量に応じた料金設定
01. ClickHouse アップデート
2025年のClickHouseのロードマップ https://github.com/ClickHouse/ClickHouse/issues/74046
Monthly Release Webinar 10
Refreshable Materialized View 11 23.12 - experimental featureとしてリリース 24.9 -
append clauseのサポート 24.10 Replicated database engineをサポート 24.10でProduction readyとしてリリース!!
12 Materialized View とは - クエリ結果を リアルタイム で事前集計して、別テーブルに保存する機能 - クエリパフォーマンスの大幅向上
- リアルタイムダッシュボードに最適 - 複雑な集計の再計算コスト削減 - データ依存アプリケーションの効率化 Source Table 計算 MV Target Table - 未加工データ - 加工済みデータ - リアルタイムに自動集計 - 集計結果は追記
13 Refreshable Materialized View とは - クエリ結果を 定期的 に事前集計して、別テーブルに保存する機能 -
システムリソースの最適化 - バッチ処理による処理効率の向上 - 大量のMaterialized Viewによる負荷の分散 - 一貫性の保証 - マスターデータとのJOIN操作で整合性維持 Source Table 計算 MV Target Table - 未加工データ - リアルタイムに自動集計 - 集計結果は追記 or 総入替 - 加工済みデータ
Parallel Replica 14 21.10 - 本機能の提案 24.10 Betaとしてリリース
Parallel Replica 15 21.10 - 本機能の提案 24.10 Betaとしてリリース そもそもレプリカってなんだっけ?
どうデータは分散されているんだっけ?
シャードとレプリカ 16 シャーディング Sharding): データを複数のノードに水平分割する技術 - クエリの並列処理によるパフォーマンス向上 - システム全体の処理能力と保存容量の拡張が可能 レプリケーション
Replication): 同一のデータを複数のノードに複製する技術 - 高可用性の確保(一部のサーバーが故障してもシステムは稼働継続) - 読み取りクエリの負荷分散 - データの信頼性と耐障害性の向上
17 シャードとレプリカについて復習 クライアント 1node構成の場合、すべてのデータを1nodeが保持する。 1nodeで処理するレコード数が多すぎる場合は? Share
18 クライアント Share 1 Share 2 Nodeを追加して、ノード当たりが処理するレコード数を分散したい。 ただし、Nodeを追加しても、データは分散されない。 Node 1
Node 2 シャードとレプリカについて復習
19 クライアント Share 1 Share 2 Distributed Table Distributed Table
1 3 2 4 Distributed Tableを使用することで、データが分散されて保持される。 ただし、1nodeが離脱するとデータ欠損してしまう Node 1 Node 2 シャードとレプリカについて復習
20 クライアント Node 1 Share 1 Node 2 Share 2
Distributed Table Distributed Table 1 3 2 4 Replicaを追加することで、高可用性を確保できる Node 3 Share 1 Node 4 Share 2 Distributed Table Distributed Table 1 3 2 4 Replica 1 Replica 1 Replica 2 Replica 2 シャードとレプリカについて復習
21 shard数は1で、リクエストを複数のノードで分散して処理しない構成。 レスポンス速度を早くしたい場合は? ClickHouse Cloud のケースは? 1 2 3 4
Object Storage Replica 1 Replica 2 Replica 3 Replica 4 クライアント ロードバランサー
22 Parallel replicaで、リクエストを複数のノードで分散して処理できる。 ClickHouse Cloud のケースは? 1 2 3 4
Object Storage Replica 1 Replica 2 Replica 3 Replica 4 クライアント ロードバランサー
03. ClickHouse Cloud アップデート
シングルサービス、シングルストレージ 24 通常のClickHouseクラウドサービス • ClickHouseを1ノードで構築可能 • ノード数は、後から増やすことが可能 • エンドポイントは、ノードが増えても変更なし •
Keeper のインスタンスは、3ノード構成
コンピュート - コンピュートの分離
スケーリング 垂直スケーリング • UI と API を利用して手動で垂直スケーリング • 負荷に応じて、自動スケーリングも可 水平スケーリング
• UI と API を利用して手動で垂直スケーリング
以前の垂直スケーリングの方法 “Break-Firstˮ アプローチ • 新しいレプリカを追加する前に、既存のレプリカを削除する • スケーリング中はサービスのキャパシティが低下 • 1ノードずつ処理するため、時間がかかる
新しい垂直スケーリングの方法 “Make Before Break MBBˮ アプローチ • 新しいレプリカを追加してから、古いレプリカを削除する • サービスの性能を低下させず、より迅速で柔軟なスケーリングが可能
ClickPipes による Postgres CDC 29
PeerDB とは 30 • PostgresなどのデータベースからClickHouseをはじめとする様々な宛先へデータ を高速かつコスト効率良くストリーミングするためのETLツール ◦ 簡単な設定と監視:UIとコマンドラインインターフェースで管理が容易 ◦ 柔軟なデプロイ:DockerやKubernetes(Helm
Charts利用可能)など、複数の方法 ◦ オープンソース:誰でも利用・改善ができる形で公開されている( 2.4k+のGitHubスター) ◦ サービス: PeerDB Cloudでマネージドサービスも提供 • よく利用される使用用途 ◦ 地理的に分散したデータセンター間でデータを同期する ◦ 複数のアプリケーション間でデータを共有する ◦ 災害対策のためにバックアップデータベースを構築する
31
ClickPipes • ClickHouse Cloudとの統合が簡単に行える • CDC(Change Data Capture)や一度限りのデータ移行に対応 • SSHトンネリングやAWS
PrivateLinkを利用して、プライベートなPostgres インスタンスに接続可能 • スロット遅延やClickPipeエラーが発生した場合、 ClickHouse Cloudの通知センターやメールでアラートが届く • 全般的な 247 on-call サポート 32
技術ドキュメントについて 33 ClickHouseの公式技術ドキュメントの日本語版がリリーされました。 情報が見つからない場合は、右下の “Ask AIˮ から日本語で質問できます。 https://clickhouse.com/docs/jp