Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Elasticsearch Aggregations
Search
Javier Rey
August 19, 2015
Technology
0
370
Elasticsearch Aggregations
Meetup Big Data -
http://www.meetup.com/Montevideo-BigData-DataScience-Meetup/events/223833509/
Javier Rey
August 19, 2015
Tweet
Share
More Decks by Javier Rey
See All by Javier Rey
Elasticsearch en producción
vierja
0
240
Tryomeetup - Elasticsearch
vierja
0
37
Tryomeetup - Elasticsearch - English
vierja
0
43
Other Decks in Technology
See All in Technology
推しは推せるときに推せ! プロダクトにフィードバックしていこう
nakasho
0
320
生産性向上チームの紹介
cybozuinsideout
PRO
1
870
レガシーをぶっ壊せ。AEONで始めるDevRelの話 / Qiita Night 2024-2-22
aeonpeople
3
1.3k
FrontDoorとWebAppsを組み合わせた際のリダイレクト処理の注意点
kenichirokimura
1
530
データベース02: データベースの概念
trycycle
0
160
SIEMを用いて、セキュリティログ分析の可視化と分析を実現し、PDCAサイクルを回してみた
coconala_engineer
0
320
どうするコスト最適化のトレードオフ
tetsuyaooooo
1
530
EMとして2023年度に頑張ったこと / What we did well in FY2023 as a EM
pauli
1
170
Databricks における 『MLOps』
databricksjapan
2
170
DevOpsメトリクスとアウトカムの接続にトライ!開発プロセスを通して計測できるメトリクスの活用方法
ham0215
2
240
Tellus の衛星データを見てみよう #mf_fukuoka
kongmingstrap
0
190
Azure Container Apps + Bicep 〜 こんな感じで運用しています
kaz29
2
480
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
243
12k
Embracing the Ebb and Flow
colly
80
4.1k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
6
1.5k
Building Flexible Design Systems
yeseniaperezcruz
319
37k
The Cost Of JavaScript in 2023
addyosmani
16
3.9k
4 Signs Your Business is Dying
shpigford
175
21k
Design by the Numbers
sachag
274
18k
Art, The Web, and Tiny UX
lynnandtonic
289
19k
What the flash - Photography Introduction
edds
64
11k
The Mythical Team-Month
searls
216
42k
Building Better People: How to give real-time feedback that sticks.
wjessup
355
18k
Large-scale JavaScript Application Architecture
addyosmani
504
110k
Transcript
Elasticsearch Aggregations Javier Rey @vierja
Aggregations Información sumarizada a partir de varios documentos o tuplas
para obtener alguna métrica o información del conjunto de datos. SELECT sum(x), count(1) GROUP BY y;
Aggregations en Big Data ◎ Grandes volúmenes de datos se
hace difícil revisar/monitorear la información. ◎ A veces queremos extraer información compleja sin tener que programar (app o jobs). ◎ Métricas en tiempo real.
Buckets terms histogram geo grids ... Aggregations en Elasticsearch Metrics
min - max - avg stats cardinality ... SELECT sum(x), count(1) GROUP BY y; BUCKET METRICS
Nested aggregations Root agg Inner agg ▸ bucket Leaf agg
▸ bucket or metric
Por qué usarlas en Elasticsearch? ◎ Combinables con búsquedas ◦
Ver agregaciones de resultados de búsquedas ◎ Fáciles de usar ◦ JSON based DSL ◎ Rápidas ◦ Estructuras de datos optimizadas ◦ Single pass de datos
Funcionamiento en clusters ◎ Agregación a nivel de shard (distribuido)
◎ Merge de las distintas sub agregaciones ◎ Algoritmos de aproximación: ◦ Cardinalidad ◉ HyperLogLog ◦ Percentiles ◉ TDigest
Aggregations interesantes ◎ Significant Terms aggregations ◦ The uncommonly common
◎ Geohash grid ◎ Terms con scripts
Ejemplos Multas de tránsito de Montevideo catalogodatos.gub.uy github.com/vierja/geojson_montevideo Queries: gist.github.com/vierja/aad3cd56fb11af129fae
SFPD Crime Incident Reporting elasticsearch.demos.tryolabs.com
Gracias! Preguntas?