Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Elasticsearch Aggregations

Javier Rey
August 19, 2015

Elasticsearch Aggregations

Javier Rey

August 19, 2015
Tweet

More Decks by Javier Rey

Other Decks in Technology

Transcript

  1. Aggregations Información sumarizada a partir de varios documentos o tuplas

    para obtener alguna métrica o información del conjunto de datos. SELECT sum(x), count(1) GROUP BY y;
  2. Aggregations en Big Data ◎ Grandes volúmenes de datos se

    hace difícil revisar/monitorear la información. ◎ A veces queremos extraer información compleja sin tener que programar (app o jobs). ◎ Métricas en tiempo real.
  3. Buckets terms histogram geo grids ... Aggregations en Elasticsearch Metrics

    min - max - avg stats cardinality ... SELECT sum(x), count(1) GROUP BY y; BUCKET METRICS
  4. Por qué usarlas en Elasticsearch? ◎ Combinables con búsquedas ◦

    Ver agregaciones de resultados de búsquedas ◎ Fáciles de usar ◦ JSON based DSL ◎ Rápidas ◦ Estructuras de datos optimizadas ◦ Single pass de datos
  5. Funcionamiento en clusters ◎ Agregación a nivel de shard (distribuido)

    ◎ Merge de las distintas sub agregaciones ◎ Algoritmos de aproximación: ◦ Cardinalidad ◉ HyperLogLog ◦ Percentiles ◉ TDigest