Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Elasticsearch Aggregations

Avatar for Javier Rey Javier Rey
August 19, 2015

Elasticsearch Aggregations

Avatar for Javier Rey

Javier Rey

August 19, 2015
Tweet

More Decks by Javier Rey

Other Decks in Technology

Transcript

  1. Aggregations Información sumarizada a partir de varios documentos o tuplas

    para obtener alguna métrica o información del conjunto de datos. SELECT sum(x), count(1) GROUP BY y;
  2. Aggregations en Big Data ◎ Grandes volúmenes de datos se

    hace difícil revisar/monitorear la información. ◎ A veces queremos extraer información compleja sin tener que programar (app o jobs). ◎ Métricas en tiempo real.
  3. Buckets terms histogram geo grids ... Aggregations en Elasticsearch Metrics

    min - max - avg stats cardinality ... SELECT sum(x), count(1) GROUP BY y; BUCKET METRICS
  4. Por qué usarlas en Elasticsearch? ◎ Combinables con búsquedas ◦

    Ver agregaciones de resultados de búsquedas ◎ Fáciles de usar ◦ JSON based DSL ◎ Rápidas ◦ Estructuras de datos optimizadas ◦ Single pass de datos
  5. Funcionamiento en clusters ◎ Agregación a nivel de shard (distribuido)

    ◎ Merge de las distintas sub agregaciones ◎ Algoritmos de aproximación: ◦ Cardinalidad ◉ HyperLogLog ◦ Percentiles ◉ TDigest