[GER] NoSQL CGN: Zeitreihendaten mit InfluxDB (05/2014)

Zeitreihendaten mit InﬂuxDB Sebastian Cohnen, @tisba  stormforger.com, @StormForgerApp  NoSQL UG
Cologne, Mai 2014

Zeitreihenda…WAS? • Zeit-Reihen-Daten (Time Series Data) • …sind Daten, die
einen inhärenten zeitlichen Bezug haben… • Sensordaten • Logdaten • Börsenkurse • “Ereignisse” (Benutzeraktionen, Fehler, Commits, Deployments, …)

Zeitreihendatenbank • Ausnutzung des inhärenten Zeitbezugs • “ORDER BY time”
• RRDTool, Graphite (carbon), OpenTSDB, Kairos, …, InﬂuxDB

Allgemeine Use Cases • (statistische) Auswertung • Zusammenfassungen • über
alles • aggregiert über Intervalle • Moving Window: letzten X Minuten, Stunden, Tage… • …

Allgemeine Use Cases • Dashboards & Visualisierungen • Monitoring &
Alerting • …

Anforderungen • Query Language • Stream Processing: On-the-Fly Verarbeitung von
eingehenden Daten • (optionales) Downsampling • Cleanup • Online-Datenbank

Herausforderungen • Je nach Anwendungsfall: SEHR VIELE Datenpunkte (>109) •
Performance, Skalierbarkeit • Cluster Support

InﬂuxDB • geschrieben in Go, Open Source seit Ende 2013(?)
• Storage Backend: LevelDB • aktuell Version 0.6 • von Paul Dix, Todd Persen, und John Shahid (ehemals Errplane)

InﬂuxDB • REST/HTTP & Protobuf API • SQL-ähnliche Abfragesprache •
Build-in Support für Authentiﬁkation und Autorisierung • Support für clustering • Clients für JavaScript, Ruby, Rails, Python, Node.js, PHP, Clojure, Common Lisp, Java Metrics, Go, Go Metrics, Scala, R, Perl, Haskell

Konzepte • Cluster, Server, User • Datenbanken (databases) • Zeitreihen
(time series), “Tabellen” • Ereignisse (events), “Zeilen”

Datenmodell der Ereignisse • Kein festes Schema • Ereignisse sind
Maps (Schlüssel-Werte Paare); wobei als Werte Strings, Zahlen, Listen und Boolean erlaubt sind • time & sequence_number sind reserviert bzw. haben eine besondere Bedeutung

Mein Anwendungsfall

StormForger.com Load Testing as a Service Platform

StormForger? • Load Testing as a ServiceS für HTTP APIs
• Vereinfachung und Automatisierung von Lasttests • Durchführung von umfangreichen und reproduzierbaren Lasttests

StormForger • Überall Metriken! …und Auswertungen! …und Visualisierungen! • Sensordaten
von Monitoring Systemen • Massig(!) Messdaten bei der Testdurchführung; aktuell 15 Datenpunkte pro Request… bei 10k+ rps über 90 Minuten… macht das…

648.000.000 Datenpunkte!

Anforderungen an Zeitreihen-DB • hohe/maximale Auﬂösung • Flexibles, On-the-Fly Downsampling
& Stream Verarbeitung • Online Abfragen mit SQL-ähnlicher Sprache • Viele Daten :)

InﬂuxDB Query Language InﬂuxDB’s SQL

Allgemeine Statistiken SELECT COUNT(duration) AS request_count, MIN(duration) AS min, MAX(duration)
AS max, MEDIAN(duration) AS median, MEAN(duration) AS mean, STDDEV(duration) AS stddev, PERCENTILE(duration, 95.0) AS p95_0, PERCENTILE(duration, 99.0) AS p99_0, SUM(size) AS size FROM tr42.requests.fullstats {

Fehler SELECT COUNT(http_status) AS count FROM tr42.requests.fullstats WHERE http_status >=
400

Aggregation über Zeit SELECT COUNT(http_status) AS count FROM tr42.requests.fullstats WHERE
http_status >= 400 GROUP BY time(1s)

Funktionen • COUNT, MIN, MAX, MEAN, MODE, MEDIAN, DISTINCT, PERCENTILE,
HISTOGRAM, DERIVATIVE, SUM, STDDEV, FIRST, LAST… • http://inﬂuxdb.org/docs/query_language/functions.html

Merges & Joins SELECT COUNT(type) FROM user_events MERGE admin_events GROUP
BY time(10m) ! SELECT * FROM MERGE /stats.*/ ! ! SELECT (hosta.value + hostb.value) AS total FROM cpu_load AS hosta INNER JOIN cpu_load AS hostb WHERE hosta.host = 'hosta.influxdb.org' AND hostb.host = 'hostb.influxdb.org'

Continuous Queries aka “Stream Processing”

Continuous Queries • Es können Abfragen hinterlegt werden, die laufend
auf neue Daten angewendet werden • Use Cases: • Downsampling, Vorberechnungen • Organisation (“fanout”)

Aggregieren & Vorberechnen SELECT PERCENTILE(value, 95) FROM response_times GROUP BY
time(5m) INTO response_times.percentiles.5m.95 SELECT COUNT(http_status) FROM response_times GROUP BY time(1m), http_status INTO response_times.count.1m.[http_status]

Organisieren SELECT *  FROM response_times INTO responses.status.[http_status] ! ! SELECT
MAX(duration), http_status FROM /stats\..*/ GROUP BY time(10m), http_status INTO max_duration.[http_status].:series_name

Cleanup

Cleanup • Es können Clean Up Regeln festgelegt werden, wann
welche Daten gelöscht werden sollen • Beispiel:  { "olderThan": "14d", "regex": "stats\\..*", "runAt": 3 }

Authentiﬁkation und Autorisierung

Authentiﬁkation und Autorisierung • Cluster Admin, Database Admin, Database User
• Rechte read/write bis auf Zeitreihen (deﬁnierbar mit Regexp) { "name": "tisba", "readFrom": ".*", "writeTo": ".*" }

Weitere Themen…

Weitere Themen… • Clustering (RAFT für Meta Daten, Sharding) •
Write Ahead Log (WAL) • (Distributed) Query Processing • Storage Details (LevelDB, LSM Trees, …)

(M)ein Fazit • Beta™ Software, “moving target”; aber läuft bei
StormForger erfolgreich in Produktion :) • intensiver Austausch auf ML und IRC, super engagierte Devs • elegant in der Nutzung und Modellierung • Lernkurve fast nicht existent! • I like :)

Fragen? Sebastian Cohnen, @tisba  stormforger.com, @StormForgerApp Loadtest anyone? :)

[GER] NoSQL CGN: Zeitreihendaten mit InfluxDB (...

[GER] NoSQL CGN: Zeitreihendaten mit InfluxDB (05/2014)

More Decks by Sebastian Cohnen

Other Decks in Technology

Featured

Transcript