Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Построение системы realtime-аналитики на ClickH...
Search
Big Data & AI Conference 2020
September 17, 2020
Technology
0
170
Построение системы realtime-аналитики на ClickHouse
Егор Матешук, CDO, Qvant.ru
Big Data & AI Conference 2020
September 17, 2020
Tweet
Share
More Decks by Big Data & AI Conference 2020
See All by Big Data & AI Conference 2020
Как искусственный интеллект помогает снизить вредные выбросы в атмосферу на металлургическом производстве.
aiconforg
0
99
Как сломать рекламную индустрию: повышаем эффективность рекламы с помощью Emotion Recognition
aiconforg
0
62
Цифровой помощник для маневрового диспетчера
aiconforg
0
290
Прогресс ученика: Как анализ больших данных помогает быстрее и дешевле достичь образовательных целей
aiconforg
0
120
Рекомендательная система для увеличения кросс-продаж: опыт инвестиционной компании
aiconforg
0
37
Дополненная аналитика: практический подход к автоматизации внутренней аналитики
aiconforg
1
54
Что делать, если данных мало?
aiconforg
0
72
Как оценить эмоциональную реакцию на рекламу дистанционно, быстро и точно.
aiconforg
0
77
Учет новых слов в языковых моделях классификации
aiconforg
0
47
Other Decks in Technology
See All in Technology
AIエージェントを5分で一気におさらい!AIエージェント「構築」元年に備えよう
yakumo
1
140
歴史から学ぶ、Goのメモリ管理基礎
logica0419
10
2.2k
複雑さを受け入れるか、拒むか? - 事業成長とともに育ったモノリスを前に私が考えたこと #RSGT2026
murabayashi
1
1.3k
20251225_たのしい出張報告&IgniteRecap!
ponponmikankan
0
110
小さく、早く、可能性を多産する。生成AIプロジェクト / prAIrie-dog
visional_engineering_and_design
0
340
Java 25に至る道
skrb
3
150
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
3.6k
あの夜、私たちは「人間」に戻った。 ── 災害ユートピア、贈与、そしてアジャイルの再構築 / 20260108 Hiromitsu Akiba
shift_evolve
PRO
0
440
Agentic AIが変革するAWSの開発・運用・セキュリティ ~Frontier Agentsを試してみた~ / Agentic AI transforms AWS development, operations, and security I tried Frontier Agents
yuj1osm
0
210
純粋なイミュータブルモデルを設計してからイベントソーシングと組み合わせるDeciderの実践方法の紹介 /Introducing Decider Pattern with Event Sourcing
tomohisa
1
670
2025年のデザインシステムとAI 活用を振り返る
leveragestech
0
700
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
Featured
See All Featured
Evolving SEO for Evolving Search Engines
ryanjones
0
93
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
0
220
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
130
Designing for Performance
lara
610
70k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
GraphQLとの向き合い方2022年版
quramy
50
14k
Unsuck your backbone
ammeep
671
58k
Color Theory Basics | Prateek | Gurzu
gurzu
0
170
GitHub's CSS Performance
jonrohan
1032
470k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Done Done
chrislema
186
16k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Transcript
Real-time аналитика для DSP Как мы выбирали архитектуру для real-time
аналитики Егор Матешук
О чем сегодня поговорим • Какие есть подходы к построению
real-time аналитики? • Какие у них плюсы и минусы? • Почему мы выбрали ClickHouse? 2
3 Для начала: какой аналитикой мы занимаемся?
Первая версия архитектуры Требования к первой версии аналитики для DSP
• Использовать адаптированные технологии • Поддерживать гео-распределенность • Поставлять данные с задержкой до 15 минут 4
5 Первая версия архитектуры DSP UI
С какими проблемами столкнулись? • Сложности мониторинга • Сложность сверки
• Проблемы с ускорением доставки 6
7 Новые требования На основе этого опыта были сформированы новые
требования: • Уменьшить “зоопарк” • Дать доступ разработчикам к данным • Ускорить доставку
Какие есть схемы для real-time аналитики? • Lambda • Kappa
8
9 Serving Backend Serving Layer Queries Lambda Batch Layer Streaming
Layer Data storage Raw data Results Batch Engine Real-time Engine
Lambda • Batch Layer - надежная пакетная обработка • Streaming
Layer - быстрая потоковая обработка • Serving Layer - абстракция для агрегатов из двух предыдущих слоев 10
11 Stream Storage Stream Processing Serving Layer Batch Processing Batch
Storage
12 Stream Storage Stream Processing Serving Layer Batch Processing Batch
Storage
13 Stream Storage Stream Processing Serving Layer Batch Processing Batch
Storage
14 Serving Backend Serving Layer Queries Lambda Batch Layer Streaming
Layer Data storage Raw data Results Batch Engine Real-time Engine
15 Lambda Data storage Raw data Results Queries
16 Lambda Плюсы + Скорость стрима + Надежность батча +
Простой репроцессинг Минусы - Дублирование логики - Дублирование сервисов
17 Kappa Serving Backend Serving Layer Queries Data storage Raw
data Results Streaming Layer Real-time Engine
Kappa • Streaming Layer - потоковая обработка • Serving Layer
- хранилище агрегатов 18
19 Kappa Serving Backend Serving Layer Queries Data storage Raw
data Results Streaming Layer Real-time Engine
20 Kappa Queries Data storage Raw data Results
21 Lambda Плюсы + Скорость стрима + Без дублирования кода
Минусы - Ограничения реализации - Сложный репроцессинг
И тут появляется ClickHouse • Интеграция с Kafka • Хранение
больших объемов данных • Materialized view • Быстрые агрегаты • Передача готовых данных “на фронт” 22
23 Роль Materialized View Raw data Aggregate Σ
Роль Materialized View • Быстрая доставка новых данных • Избавление
от периодических джоб 24
25 Serving Backend Serving Layer Queries Lambda Batch Layer Streaming
Layer Data storage Raw data Results Batch Engine Real-time Engine
26 Queries Lambda Data storage Raw data Results SQL Mat
View
27 Первая версия архитектуры DSP UI
28 Вторая версия архитектуры DSP UI
Что нужно учитывать • Mat View проигрывает по функционалу Flink
• Заливку из кафки удобнее делать отдельными инструментами • “Грабли” в поддержке базы 29
Результаты • Уменьшение “зоопарка” технологий • Сокращение времени доставки данных
• Упрощение разработки 30
Выводы ClickHouse позволяет • Решать задачу аналитики в реальном времени
• Упростить разработку аналитического решения 31
Буду рад вопросам и конструктивной критике :) Это всё Егор
Матешук
[email protected]
https://t.me/Egorios