Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Построение системы realtime-аналитики на ClickH...
Search
Big Data & AI Conference 2020
September 17, 2020
Technology
0
170
Построение системы realtime-аналитики на ClickHouse
Егор Матешук, CDO, Qvant.ru
Big Data & AI Conference 2020
September 17, 2020
Tweet
Share
More Decks by Big Data & AI Conference 2020
See All by Big Data & AI Conference 2020
Как искусственный интеллект помогает снизить вредные выбросы в атмосферу на металлургическом производстве.
aiconforg
0
99
Как сломать рекламную индустрию: повышаем эффективность рекламы с помощью Emotion Recognition
aiconforg
0
62
Цифровой помощник для маневрового диспетчера
aiconforg
0
290
Прогресс ученика: Как анализ больших данных помогает быстрее и дешевле достичь образовательных целей
aiconforg
0
120
Рекомендательная система для увеличения кросс-продаж: опыт инвестиционной компании
aiconforg
0
37
Дополненная аналитика: практический подход к автоматизации внутренней аналитики
aiconforg
1
54
Что делать, если данных мало?
aiconforg
0
72
Как оценить эмоциональную реакцию на рекламу дистанционно, быстро и точно.
aiconforg
0
77
Учет новых слов в языковых моделях классификации
aiconforg
0
47
Other Decks in Technology
See All in Technology
業務の煩悩を祓うAI活用術108選 / AI 108 Usages
smartbank
9
19k
Agentic AIが変革するAWSの開発・運用・セキュリティ ~Frontier Agentsを試してみた~ / Agentic AI transforms AWS development, operations, and security I tried Frontier Agents
yuj1osm
0
210
複雑さを受け入れるか、拒むか? - 事業成長とともに育ったモノリスを前に私が考えたこと #RSGT2026
murabayashi
1
1.3k
Redshift認可、アップデートでどう変わった?
handy
1
130
純粋なイミュータブルモデルを設計してからイベントソーシングと組み合わせるDeciderの実践方法の紹介 /Introducing Decider Pattern with Event Sourcing
tomohisa
1
680
「リリースファースト」の実感を届けるには 〜停滞するチームに変化を起こすアプローチ〜 #RSGT2026
kintotechdev
0
630
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
4
21k
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.5k
AI with TiDD
shiraji
1
340
SES向け、生成AI時代におけるエンジニアリングとセキュリティ
longbowxxx
0
300
2025年 山梨の技術コミュニティを振り返る
yuukis
0
150
サラリーマンソフトウェアエンジニアのキャリア
yuheinakasaka
9
2.6k
Featured
See All Featured
Heart Work Chapter 1 - Part 1
lfama
PRO
4
35k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
200
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
72
Marketing to machines
jonoalderson
1
4.5k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
0
34
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
41
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
360
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.4k
How to Talk to Developers About Accessibility
jct
1
94
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
Transcript
Real-time аналитика для DSP Как мы выбирали архитектуру для real-time
аналитики Егор Матешук
О чем сегодня поговорим • Какие есть подходы к построению
real-time аналитики? • Какие у них плюсы и минусы? • Почему мы выбрали ClickHouse? 2
3 Для начала: какой аналитикой мы занимаемся?
Первая версия архитектуры Требования к первой версии аналитики для DSP
• Использовать адаптированные технологии • Поддерживать гео-распределенность • Поставлять данные с задержкой до 15 минут 4
5 Первая версия архитектуры DSP UI
С какими проблемами столкнулись? • Сложности мониторинга • Сложность сверки
• Проблемы с ускорением доставки 6
7 Новые требования На основе этого опыта были сформированы новые
требования: • Уменьшить “зоопарк” • Дать доступ разработчикам к данным • Ускорить доставку
Какие есть схемы для real-time аналитики? • Lambda • Kappa
8
9 Serving Backend Serving Layer Queries Lambda Batch Layer Streaming
Layer Data storage Raw data Results Batch Engine Real-time Engine
Lambda • Batch Layer - надежная пакетная обработка • Streaming
Layer - быстрая потоковая обработка • Serving Layer - абстракция для агрегатов из двух предыдущих слоев 10
11 Stream Storage Stream Processing Serving Layer Batch Processing Batch
Storage
12 Stream Storage Stream Processing Serving Layer Batch Processing Batch
Storage
13 Stream Storage Stream Processing Serving Layer Batch Processing Batch
Storage
14 Serving Backend Serving Layer Queries Lambda Batch Layer Streaming
Layer Data storage Raw data Results Batch Engine Real-time Engine
15 Lambda Data storage Raw data Results Queries
16 Lambda Плюсы + Скорость стрима + Надежность батча +
Простой репроцессинг Минусы - Дублирование логики - Дублирование сервисов
17 Kappa Serving Backend Serving Layer Queries Data storage Raw
data Results Streaming Layer Real-time Engine
Kappa • Streaming Layer - потоковая обработка • Serving Layer
- хранилище агрегатов 18
19 Kappa Serving Backend Serving Layer Queries Data storage Raw
data Results Streaming Layer Real-time Engine
20 Kappa Queries Data storage Raw data Results
21 Lambda Плюсы + Скорость стрима + Без дублирования кода
Минусы - Ограничения реализации - Сложный репроцессинг
И тут появляется ClickHouse • Интеграция с Kafka • Хранение
больших объемов данных • Materialized view • Быстрые агрегаты • Передача готовых данных “на фронт” 22
23 Роль Materialized View Raw data Aggregate Σ
Роль Materialized View • Быстрая доставка новых данных • Избавление
от периодических джоб 24
25 Serving Backend Serving Layer Queries Lambda Batch Layer Streaming
Layer Data storage Raw data Results Batch Engine Real-time Engine
26 Queries Lambda Data storage Raw data Results SQL Mat
View
27 Первая версия архитектуры DSP UI
28 Вторая версия архитектуры DSP UI
Что нужно учитывать • Mat View проигрывает по функционалу Flink
• Заливку из кафки удобнее делать отдельными инструментами • “Грабли” в поддержке базы 29
Результаты • Уменьшение “зоопарка” технологий • Сокращение времени доставки данных
• Упрощение разработки 30
Выводы ClickHouse позволяет • Решать задачу аналитики в реальном времени
• Упростить разработку аналитического решения 31
Буду рад вопросам и конструктивной критике :) Это всё Егор
Матешук
[email protected]
https://t.me/Egorios