Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Umsetzung von BI-Lösungen mit Unterstützung ein...

exensio
March 05, 2015

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine

Vortrag beim 6. Workshop Open Source Business Intelligence
auf Basis von Elasticsearch

exensio

March 05, 2015
Tweet

More Decks by exensio

Other Decks in Technology

Transcript

  1. Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine 6. Workshop Open

    Source Business Intelligence 05.03.2015 Tobias Kraft, exensio GmbH
  2. 3 Funktionen einer Suche Suchmaschinen Blätterung Sortierung Facettierung Unstrukturierte Suche

    Strukturierte Suche Highlighting Autocomplete Did you mean Synonyme
  3. 6 Elasticsearch im Überblick • Suchmaschine unter Apache 2 Open

    Source License • Erstes Release 2010 • Basiert auf Java • Basiert auf Lucene • JSON-API • Schemalos • Plugins • Runterladen und loslegen • Im Trend Elasticsearch
  4. 8 Elasticsearch Node 1 otcdrug document Node 2 otcdrug document

    1 1 2 3 1‘ 4 Replica: 1 Replica: 0 Neuer Knoten im Cluster Große Datenmengen über Shards verwalten
  5. 9 Elasticsearch Node 1 otcdrug document Node 2 otcdrug document

    Node 3 otcdrug document 1 1 2 3 1‘ 4 1‘ 2‘ 3‘ Replica: 0 Replica: 1 4‘ Neuer Knoten im Cluster Große Datenmengen über Shards verwalten
  6. 10 Aggregationen - Buckets und Metrics Elasticsearch Metrics • Anzahl

    • Summe • Min / Max / Average • Varianz • Perzentile Buckets • Terme • Ranges • Histograme • Geo-Distanz http://mrg.bz/Nn57cJ http://mrg.bz/lQNZFq
  7. 13 BI mit Elasticsearch BI-Stack mit Elasticsearch Eigene Loader mit

    ES-Client (Bsp. SpringBoot) Implementierungen für • JDBC • CSV • … Logstash Eigene Visualisierung Analyse ETL Speicherung / Berechnungen
  8. 14 Datentransport mit Logstash BI-Stack mit Elasticsearch • Event Processing

    Engine • Optimiert für Log-Dateien • Pipeline-Prinzip • Input (50+) • Filter (60+) • Output (75+) input filter output date{…} elasticsearch rename{…} grok{…} file
  9. 15 Visualisierungen mit Kibana BI-Stack mit Elasticsearch • Aktuelles Release:

    Kibana 4 • Browserbasierte Visualisierung von Daten • Abfragen über JSON an ES • Aufbereitung über • Discover • Visualize • Dashboards
  10. 16 Eigene Analyse-Komponenten sind einfach zu erstellen Darstellung der JSON-Rückgabewerte

    von ES auf Basis von JavaScript BI-Stack mit Elasticsearch
  11. 25 Competitive Intelligence als weiteres Einsatzszenario Beispiel Shop/Handel: Mapping bspw.

    über den Weinnamen, falls keine eindeutige ID wie EAN Code vorhanden ist
  12. 26 Fazit • Aggregationen ersetzen Dimensionen im Star-Schema • Near

    Realtime • Leichtgewichtig • Kostengünstige Alternative • Einfach zu integrieren und erweitern • Kombinierbar mit Vorteilen von Suchmaschinen • Matching • Unstrukturierte Daten