Observability For Serverless Workloads

Observability for Serverless Workloads Ara Pulido @arapulido

Developer Advocate at Datadog @arapulido at Twitter [email protected] About me

Observability

Observability Microservices Containers FaaS Serverless CI/CD ML Big Data

A bit of history

Monoliths

Diﬀerent user expectations

Infrastructure monitoring

Microservices

Infrastructure monitoring is no longer enough

Observability A measure of how well internal states of a
system can be inferred from knowledge of its external outputs

Logs Metrics Tracing

Logs Metrics Tracing Events User/Browser tests Data visualization ML Queries

Serverless

NO ACCESS TO THE UNDERLYING OS CHARGED BY EXECUTION TIME
/ MEMORY ALLOCATED IN MANY CLOUDS, RUNTIMES ARE A BIT OF A BLACKBOX Serverless

Logs Metrics Tracing Demo application https://dtdg.co/faas-sample

Demo application 1 face - No duplicates No faces >
1 face Duplicated

Demo application Search Faces Web app Index Faces Persist Data
Detect Faces

Demo application Detect Faces Search Faces Web app Index Faces
Persist Data

Detect Faces

THE PLATFORM LOGS STDOUT, STDERR LOG AS MUCH AS POSSIBLE
(PART OF THE PLATFORM) Logs USE LOG FORWARDERS TO COLLECT THEM ELSEWHERE USE YOUR LANGUAGE LOGGING LIBRARY TO DO MORE COMPLEX STUFF

Logs Cloud Log System Log Forwarder Log system

Collecting Metrics

Collecting metrics Send batch Send batch Send batch

Cold start Cold start Execution context Collecting metrics

Cold start EXECUTION CONTEXT SHARES DISK ACROSS INVOCATIONS Cold start
Execution context Collecting metrics

Cold start EXECUTION CONTEXT SHARES DISK ACROSS INVOCATIONS Cold start
Send batch Execution context Collecting metrics

Cold start WE CANNOT KNOW WHEN IT IS GOING TO
BE GARBAGE COLLECTED Cold start Send batch Execution context Collecting metrics EXECUTION CONTEXT SHARES DISK ACROSS INVOCATIONS Send batch

Metrics in Logs Cloud Log System Log Forwarder Metrics

Infrastructure Metrics

4 golden signals LATENCY TRAFFIC SATURATION ERRORS

DURATION INVOCATIONS THROTTLE ERRORS 4 golden signals

Serverless speciﬁc COLD STARTS WARM STARTS

BILLED DURATION - DURATION Serverless speciﬁc

Use metrics to save $$$ (and time) ESTIMATED COST PER
FUNCTION

Use metrics to save $$$ (and time) 700ms 500ms 300ms
128MB 192MB 320MB 128MB = $ 0.000001465 192MB = $ 0.000001565 320MB = $ 0.000001563

Business Metrics

EACH FUNCTION IS A POTENTIAL BUSINESS METRIC GATHER THOSE AND
USE THEM TO IMPROVE YOUR BUSINESS Business metrics

Business metrics

S1 S2 S3 S4 S5

S1 S2 S3 S4 S5 TRACE SPANS

Instrumentation with traces

No OS / No agent

No OS / No agent Use cloud speciﬁc libraries for
your functions

X-Ray traces

your functions … but make sure you don’t break your current traces

Detect Faces

Full app trace

your functions … but make sure you don’t break your current traces or use logs!!

Take aways

USE LOGS FOR METRICS TO AVOID LOSING DATA ADD YOUR
FUNCTIONS TO YOUR CURRENT TRACES (if possible) LOGS ARE CHEAP. LOG A LOT. TRACK THOSE BUSINESS METRICS

Thank you! (we are hiring!) Ara Pulido @arapulido Demo app:
https://dtdg.co/faas-sample

Observability For Serverless Workloads

Observability For Serverless Workloads

More Decks by Ara

Other Decks in Programming

Featured

Transcript