Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Observability 101: Monitoring Your Mobile Apps

Avatar for Bruno Aybar Bruno Aybar
November 14, 2025
3

Observability 101: Monitoring Your Mobile Apps

The backend dashboard shows 99.999% uptime, but our users (and the frontend team) insist "your mobile app sucks". This disconnect highlights a critical gap between monitoring and observability.

This session is a 101 guide to understanding the state of your mobile applications by leveraging their external outputs, or "signals". We will demystify the "three pillars" of telemetry:

- Metrics (The "What"): The numerical measurements of your app's health. We'll cover key types: Counters, Gauges, and Histograms.
- Logs (The "Context"): The timestamped, contextual records that explain why something happened
- Traces (The "Journey"): Collections of structured logs that provide a complete, correlated view of a single operation

Avatar for Bruno Aybar

Bruno Aybar

November 14, 2025
Tweet

Transcript

  1. “Es una medida de qué tan bien se puede conocer

    el estado de un sistema a partir de sus múltiples salidas (señales)” Observabilidad
  2. Libreta de Notas Pepito Juanita Examen 1 20 16 Examen

    2 20 13 Examen 3 17 7 Promedio final 19 12
  3. Libreta de Notas Pepito Juanita Examen 1 20 16 Examen

    2 20 13 Examen 3 17 7 Promedio final 19 12 Métricas
  4. Correo institucional "Varios profesores me indican que Juanita se ha

    estado quedando dormida en clase." — Miss Alyssa
  5. Correo institucional "Varios profesores me indican que Juanita se ha

    estado quedando dormida en clase." — Miss Alyssa Logs
  6. Registro de asistencia • Lunes: ◦ Estado: Tarde ◦ Hora

    exacta: 07:48am ◦ Justificado: ✅ ◦ Motivo: Accidente de tránsito • Martes: … • Miercoles: …
  7. Signals Las señales son outputs que describen la actividad subyacente

    del sistema y las aplicaciones que se ejecutan en una plataforma.
  8. Signals (Telemetry data) Una medición de un servicio realizada en

    tiempo de ejecución Registro (con marca de tiempo) estructurado o no, con metadatos opcionales. Una colección de logs estructurados con contexto, duración, correlación, jerarquía, y más Metrics Logs Traces
  9. Metric Una medición (numérica) realizada en tiempo de ejecución. Además,

    consiste de: - el momento en que fue capturada y - los metadatos asociados.
  10. Metrics → Metadata app_launched (count + 1) • timestamp =

    … • brand = 'pixel' • os_platform = android • os_version = '15' • app_version = '1.0.0' Cada uno de estos aumenta la cardinalidad
  11. Metrics → Types Un valor que se acumula a lo

    largo del tiempo Mide el valor actual de una métrica al momento de su medición Muestra la distribución de un conjunto de valores numéricos a lo largo del tiempo Counter Gauge (indicador) Histogram
  12. Metrics → Histogram Medición que muestra la distribución de un

    conjunto de valores numéricos a lo largo del tiempo
  13. Open Telemetry Framework + toolkit de Observabilidad diseñado para crear

    data y manejar datos de telemetría "de lejos"
  14. Traces Una colección de logs estructurados con contexto, duración, correlación,

    jerarquía, y más Correctamente implementados, permiten realizar "tracing distribuido"
  15. Traces trace_id = ABC | span_id = 1 App startup

    trace_id = ABC | span_id = 2 Start process trace_id = ABC | span_id = 3 Class loading trace_id = ABC | span_id = 4 Activity launch
  16. Traces trace_id = ABC | span_id = 1 App startup

    trace_id = ABC | span_id = 2 Start process trace_id = ABC | span_id = 3 Class loading trace_id = ABC | span_id = 4 Activity launch Para otra charla…
  17. Libreta de Notas Pepito Juanita Examen 1 20 16 Examen

    2 20 13 Examen 3 17 7 Promedio final 19 12
  18. Libreta de Notas Pepito Juanita Examen 1 20 16 Examen

    2 20 13 Examen 3 17 7 Promedio final 19 12 ¿Son valores aceptables?
  19. Libreta de Notas Pepito Juanita Examen 1 20 16 Examen

    2 20 13 Examen 3 19 7 Promedio final 20 ✅ 12 ❌ Service Level Indicator (SLI)
  20. — Padre e hijos "No siempre se logra la perfección,

    es entendible. Sin embargo, acordemos que no deben desaprobar" (promedio final > 10)
  21. Service Level Metrics La métrica que monitoreas. El valor esperado

    de la métrica que monitoreas. El valor que, contractualmente, estamos obligados a cumplir. SLI (indicator) SLO (objective) SLA (agreement)
  22. No solo sé que ocurre un error. También tengo las

    herramientas para entender el porqué. — Developer
  23. Métricas (session stability) Monitoreo: "De aquello que sabemos que no

    sabemos" Qué Cómo How many crash-free users? Known Unknowns
  24. Observabilidad: "De aquello que no sabemos que no sabemos" Unknown

    Unknowns Logs Qué Cómo Why did these sessions crashed?
  25. No es solo conocer el estado del sistema, sino también

    tener las herramientas para entender porqué se encuentra en ese estado. Observabilidad
  26. Otras consideraciones • Why is observability so expensive? • Why

    does no one talk about mobile observability? • Embrace, Bitdrift • Play / App Store, Bugsnag, Dynatrace, NewRelic, etc. 01 03 02 04 La observabilidad es costosa La observabilidad en mobile es difícil Herramientas de tracing para mobile Herramientas de observability para mobile
  27. Honeycomb • Observability: Glossary • Monitoring vs Observability • Understanding

    High Cardinality and its role in Observability Matt Klein / bitdrifts • Why is observability so expensive? • Why does no one talk about mobile observability? Embrace • Defining and measuring mobile SLOs NewRelic • What is Observability Open Telemetry • Observability Primer Recursos