Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine

exensio
April 15, 2015

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine

Vortrag TDWI Roundtable Stuttgart

exensio

April 15, 2015
Tweet

More Decks by exensio

Other Decks in Technology

Transcript

  1. 6 Near Realtime http://www.morguefile.com/archive/display/196583 • Inkrementell Indexieren • Änderungen auch

    im Cluster schnell verfügbar • Onlineabfragen für Facetting / Aggregationen
  2. 8 Elasticsearch im Überblick • Suchmaschine unter Apache 2 Open

    Source License • Erstes Release 2010 • Firma hinter Elasticsearch: • Basiert auf Java • Basiert auf Lucene • JSON-API • Schemalos • Plugins • Runterladen und loslegen • Im Trend
  3. 10 Node 1 otcdrug document Node 2 otcdrug document 1

    1 2 3 1‘ 4 Replica: 1 Replica: 0 Neuer Knoten im Cluster Große Datenmengen über Shards verwalten
  4. 11 Node 1 otcdrug document Node 2 otcdrug document Node

    3 otcdrug document 1 1 2 3 1‘ 4 1‘ 2‘ 3‘ Replica: 1 Replica: 1 4‘ Neuer Knoten im Cluster Große Datenmengen über Shards verwalten
  5. 12 Aggregationen - Buckets und Metrics Metrics • Anzahl •

    Summe • Min / Max / Average • Varianz • Perzentile Buckets • Terme • Ranges • Histogramme • Geo-Distanz http://mrg.bz/Nn57cJ http://mrg.bz/lQNZFq
  6. 16 BI mit Elasticsearch Eigene Loader mit ES-Client (Bsp. SpringBoot)

    Implementierungen für • JDBC • CSV • … Logstash Eigene Visualisierung Analyse ETL Speicherung / Berechnungen
  7. 17 ELK-Stack (Logstash, Elasticsearch, Kibana) Eigene Loader mit ES-Client (Bsp.

    SpringBoot) Implementierungen für • JDBC • CSV • … Eigene Visualisierung Analyse ETL Speicherung / Berechnungen Logstash Shield für Security
  8. 18 Datentransport mit Logstash • Event Processing Engine • Optimiert

    für Log-Dateien • Pipeline-Prinzip • Input (50+) • Filter (60+) • Output (75+) input filter output date{…} elasticsearch rename{…} grok{…} file
  9. 19 Visualisierungen mit Kibana • Aktuelles Release: Kibana 4.0.2 •

    Browserbasierte Visualisierung von Daten • Abfragen über JSON an ES • Aufbereitung über • Discover • Visualize • Dashboards
  10. 21 Eigene Analyse-Komponenten sind einfach zu erstellen Darstellung der JSON-Rückgabewerte

    von ES auf Basis von JavaScript Abfrage und Datenhaltung Innensensor u. Erfassung Knoten 1 Knoten 2 Innensensor u. Erfassung Innensensor u. Erfassung Innensensor u. Erfassung Dashboard Außen-Wetterstation
  11. 31 Competitive Intelligence als weiteres Einsatzszenario Beispiel Shop/Handel: Mapping bspw.

    über den Weinnamen, falls keine eindeutige ID wie EAN Code vorhanden ist
  12. 32 Fazit • Aggregationen ersetzen Dimensionen im Star-Schema • Near

    Realtime • Leichtgewichtig • Kostengünstige Alternative • Einfach zu integrieren und erweitern • Kombinierbar mit Vorteilen von Suchmaschinen • Matching • Unstrukturierte Daten