Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
リアルタイムデータ分析基盤をKafka(Strimzi) & Druidで構築し
Search
Kenta Kozuka
June 30, 2021
Programming
120
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
リアルタイムデータ分析基盤をKafka(Strimzi) & Druidで構築し
Kenta Kozuka
June 30, 2021
More Decks by Kenta Kozuka
See All by Kenta Kozuka
フィーチャーフラグ&ABテストツールBucketeer開発の経緯 〜社内基盤としてのプロダクト戦略〜
kentakozuka
0
230
事業部を超えた 開発生産性向上に挑戦する
kentakozuka
7
1.7k
1000人を超えるエンジニア組織へのGitHub Copilot導入促進
kentakozuka
0
380
KubeCon 2023 China Recap & ブースを出展してきました
kentakozuka
0
300
PipeCD Good First Issues
kentakozuka
0
53
サイバーエージェントでCDツールを内製した話
kentakozuka
1
550
PipeCDでGitOpsやってみよう!
kentakozuka
0
990
サイバーエージェントのフィーチャーフラグを活用した高速開発
kentakozuka
0
65
フィーチャーフラグを使用した開発で 迅速かつ安全にリリースする
kentakozuka
0
87
Other Decks in Programming
See All in Programming
AutonomyとControlのあいだ:Graflowで記述するAIエージェント協調
myui
0
120
TSKaigi Night Talks 2026_TypeScriptでサプライチェーンの整合性を型に閉じ込める
geekplus_tech
0
330
Copilot CLI の継戦能力を高める コンテキスト管理
nozomutu
1
1.2k
ADKを使って簡単にAIエージェントを作ってみよう
k1mu21
0
260
JJUG CCC 2026 Spring: JSpecify で実現する Kotlin フレンドリーな Java API 設計
ternbusty
1
160
スマートグラスで並列バイブコーディング
hyshu
0
120
Inside Stream API
skrb
1
680
3Dシーンの圧縮
fadis
1
730
Language Server 使ってる? 〜VSCode と Zed の場合〜 / Are you using a Language Server? ~For VS Code and Zed~
handlename
0
780
ECSアプリログをFireLensでコスト削減しようとしたけど諦めた話 in Fargate×Node.js
akihisaikeda
2
4k
A2UI という光を覗いてみる
satohjohn
1
130
セキュリティの専門家じゃなくてもできる。「セキュリティ意識」をアップデートして サプライチェーン攻撃への耐性を高めよう。
tk3fftk
5
710
Featured
See All Featured
Skip the Path - Find Your Career Trail
mkilby
1
140
A Soul's Torment
seathinner
6
2.9k
WCS-LA-2024
lcolladotor
0
630
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.9k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Between Models and Reality
mayunak
4
330
Rails Girls Zürich Keynote
gr2m
96
14k
Documentation Writing (for coders)
carmenintech
77
5.4k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
170
Technical Leadership for Architectural Decision Making
baasie
3
400
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
Bash Introduction
62gerente
615
220k
Transcript
リアルタイムデータ分析基盤を Kafka(Strimzi) & Druidで構築した @kentakozuka
@kentakozuka @CyberAgent - Backend - Go, Python - 今やっていること →
In-House Feature Flag & A/B Testing Platform 「Bucketeer」という名前です 社内プロダクト用フィーチャーフラグ &
ABテストプラットフォーム 複数のプロダクトで導入 今回はGKE上に構築しているデータ分 析パイプラインの話
コスト高 データ量: 5TB/week BigQuery Druid & Kafka コスト削減 GKEのノード分のコスト
Druid 大規模データ分析 - 列指向 - 大量のインサート - リアルタイム分析 - 並列処理
- 統計量 スケーラブル インテグレーション - 分散型DB - Self-healing - Self-balancing - Kafka - Kenesis - S3 - GCS - HDFS Airbnb, Alibaba, Expedia, Lyft, Netflix, Optimizely, Twitter, Yahoo などで導入実績 https://druid.apache.org/druid-powered - 公式Operatorあり - GitOps - ちょっと使いづらい On Kubernetes
But, Pub/Sub未対応… - PRあるけど進んでない
Strimzi Kafka Operator - Kafka is now Kubernetes-Native - GitOps
- シンプルで使いやすい - Zookeeper, Exporterも全部やってくれる - ヘルスチェック、ログ、メトリクス
After
所感 & まとめ 導入はそれなりに大変だけど、メリットはある Druid - 分析基盤として性能・機能共にフィットするプロダクトは多そう - チューニングが難しい -
Pub/Sub対応してほしい - 開発が活発なGo SDKがほしい Strimzi - シンプルで使いやすい Kubernetes上に構築するときOperatorがあると安心する
Thank you!