Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Elasticsearch Aggregations
Search
Javier Rey
August 19, 2015
Technology
0
410
Elasticsearch Aggregations
Meetup Big Data -
http://www.meetup.com/Montevideo-BigData-DataScience-Meetup/events/223833509/
Javier Rey
August 19, 2015
Tweet
Share
More Decks by Javier Rey
See All by Javier Rey
Elasticsearch en producción
vierja
0
300
Tryomeetup - Elasticsearch
vierja
0
40
Tryomeetup - Elasticsearch - English
vierja
0
46
Other Decks in Technology
See All in Technology
LayerX QA Night#1
koyaman2
0
300
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
250
ハッカソンから社内プロダクトへ AIエージェント ko☆shi 開発で学んだ4つの重要要素
leveragestech
0
500
AI時代のアジャイルチームを目指して ー スクラムというコンフォートゾーンからの脱却 ー / Toward Agile Teams in the Age of AI
takaking22
2
570
AWSの新機能をフル活用した「re:Inventエージェント」開発秘話
minorun365
2
530
Next.js 16の新機能 Cache Components について
sutetotanuki
0
210
MySQLのSpatial(GIS)機能をもっと充実させたい ~ MyNA望年会2025LT
sakaik
0
200
フィッシュボウルのやり方 / How to do a fishbowl
pauli
2
440
_第4回__AIxIoTビジネス共創ラボ紹介資料_20251203.pdf
iotcomjpadmin
0
170
複雑さを受け入れるか、拒むか? - 事業成長とともに育ったモノリスを前に私が考えたこと #RSGT2026
murabayashi
0
730
田舎で20年スクラム(後編):一個人が企業で長期戦アジャイルに挑む意味
chinmo
1
150
[2025-12-12]あの日僕が見た胡蝶の夢 〜人の夢は終わらねェ AIによるパフォーマンスチューニングのすゝめ〜
tosite
0
240
Featured
See All Featured
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
270
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
530
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Paper Plane (Part 1)
katiecoart
PRO
0
2.6k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
75
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
400
A designer walks into a library…
pauljervisheath
210
24k
KATA
mclloyd
PRO
33
15k
Darren the Foodie - Storyboard
khoart
PRO
0
2k
GraphQLの誤解/rethinking-graphql
sonatard
74
11k
Transcript
Elasticsearch Aggregations Javier Rey @vierja
Aggregations Información sumarizada a partir de varios documentos o tuplas
para obtener alguna métrica o información del conjunto de datos. SELECT sum(x), count(1) GROUP BY y;
Aggregations en Big Data ◎ Grandes volúmenes de datos se
hace difícil revisar/monitorear la información. ◎ A veces queremos extraer información compleja sin tener que programar (app o jobs). ◎ Métricas en tiempo real.
Buckets terms histogram geo grids ... Aggregations en Elasticsearch Metrics
min - max - avg stats cardinality ... SELECT sum(x), count(1) GROUP BY y; BUCKET METRICS
Nested aggregations Root agg Inner agg ▸ bucket Leaf agg
▸ bucket or metric
Por qué usarlas en Elasticsearch? ◎ Combinables con búsquedas ◦
Ver agregaciones de resultados de búsquedas ◎ Fáciles de usar ◦ JSON based DSL ◎ Rápidas ◦ Estructuras de datos optimizadas ◦ Single pass de datos
Funcionamiento en clusters ◎ Agregación a nivel de shard (distribuido)
◎ Merge de las distintas sub agregaciones ◎ Algoritmos de aproximación: ◦ Cardinalidad ◉ HyperLogLog ◦ Percentiles ◉ TDigest
Aggregations interesantes ◎ Significant Terms aggregations ◦ The uncommonly common
◎ Geohash grid ◎ Terms con scripts
Ejemplos Multas de tránsito de Montevideo catalogodatos.gub.uy github.com/vierja/geojson_montevideo Queries: gist.github.com/vierja/aad3cd56fb11af129fae
SFPD Crime Incident Reporting elasticsearch.demos.tryolabs.com
Gracias! Preguntas?