Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Comment OpenTelemetry peut transformer votre monitoring en unifiant vos logs/metrics/traces

Comment OpenTelemetry peut transformer votre monitoring en unifiant vos logs/metrics/traces

Vincent Behar

April 22, 2022
Tweet

More Decks by Vincent Behar

Other Decks in Technology

Transcript

  1. 2 Senior Engineer Vincent Behar https://twitter.com/vbehar Twitter French video game

    company Ubisoft https://github.com/vbehar GitHub ABOUT ME
  2. 3 AGENDA 1. Le problème 2. OpenTelemetry 3. OpenTelemetry @Ubisoft

    4. Génération automatique de metrics/logs 5. Stratégies de déploiement
  3. 4 Evènements « brut » LOGS • Plusieurs librairies ?

    • Sortie ? Stdout / fichier / … • Format ? JSON / texte • Logs structurés ? • Noms des labels ? • ELK / EFK
  4. 5 Aggrégations METRICS • Nommage ? • Unités ? •

    Labels ? • Relation avec les logs ? • Prometheus / Grafana
  5. 6 Visibilité en profondeur TRACES • Hiérarchie de spans •

    Durée, attributs, logs, … • Environment distribué • Services graph • Noms des attributs ? • Relation avec les logs et metrics ? • Jaeger
  6. 7 Les 3 pilliers… LE PROBLEME Silos • 1 source

    (application) • Plusieurs chemins • Plusieurs destinations • Pas de vision unifiée • Duplication • Connaissances & compétences • Temps d’intervention • …
  7. 10 OPENTELEMETRY Open source • 2019 • OpenTracing • OpenCensus

    • CNCF Contributeurs • Amazon, Google, Microsoft, RedHat, … • Lightstep, Splunk, Dynatrace, Grafana, Honeycomb, New Relic, Datadog, Elastic, …
  8. 12 Specifications • Traces: stable • Metrics: stable • Logs:

    stable • Semantic Conventions • Propagation • Protocol (OTLP) • … Implementations • APIs • SDKs • Support de librairies • 11 languages • Instrumentation automatique en Java et Python Collecteur • Interopérabilité • Ecrit in Go • OpenCensus Service • « killer feature » OPENTELEMETRY
  9. 13 Composants • 50+ récepteurs • 40+ exporteurs • 20+

    processeurs • 10+ extensions • Comp. personnalisés • Distributions Collecte, traitement et publication – de manière intéropérable OPENTELEMETRY COLLECTOR Pipelines • 1 ou plusieurs par type
  10. 17 Metric requetes{path=/toto} 42 Log { "timestamp": "…", "msg": "requête",

    "utilisateur": "alain", "path": "/toto", "code": "200" } Span • Operation: « requête » • Heure début / fin • Attributs • Utilisateur: alain • Path: /toto • Code: 200 • Logs • Heure • Message • Attributs RESULTAT DE L’INSTRUMENTATION
  11. 22 Quand ? • Compléter des metrics/logs manquant • Requêtes

    HTTP • Interactions entre services – client & serveur • Applications tierces Comment ? • Processeur OpenTelemetry Collector • Histogram basé sur les spans Avantages ? • Simplification de l’instrumentation du code • Correlation automatique (exemplars) • Rétention des metrics • Vues différentes GENERATION AUTOMATIQUE DE METRICS / LOGS
  12. 23 Agent • Kubernetes DaemonSet • Collecte de logs par

    nœud • Collecte de metrics Prometheus par nœud • Collecte d’informations du kubelet (par nœud) • Collecte d’informations de la machine • Réception de spans à travers un service kubenetes STRATEGIES DE DEPLOIEMENT DU COLLECTEUR
  13. 24 Standalone • Kubernetes Deployment • Collecte d’informations du cluster

    Kubernetes • Collecte de metrics Prometheus au niveau des services kubernetes • (réception de spans à travers un service kubenetes) • … STRATEGIES DE DEPLOIEMENT DU COLLECTEUR
  14. 25 Sidecar • Kubernetes Container • Interopérabilité entre l’app et

    l’environment • Collecte des traces • Facilité de mise en place • Otelcol Operator – injection automatique dans les pods Kubernetes STRATEGIES DE DEPLOIEMENT DU COLLECTEUR
  15. 26 POC / Demo • Instrumentation automatique en Java et

    Python • Collecteur • Plateforme unifiée • Grafana • SaaS ? Code existant • Interopérabilité • Comblez les trous – avec des traces ? • Sidecar Nouveau code • Uniquement des traces? • Limiter au maximum la duplication • Conventions de nommage Workshop CNCF Paris – OpenTelemetry, jeudi 12 mai à Ubisoft https://meetup.com/Cloud-Native-Computing-Paris/ PAR OU COMMENCER ?
  16. 27 OpenTelemetry Collector • Encore plus d’unification entre les logs/metrics/traces

    • « Control Plane »: contrôle de la configuration à distance Instrumentation automatique • eBPF • Pixie Continuous Profiling • Nouveaux outils inspirés de Prometheus: Parca, Pyroscope • Intégration entre Pyroscope et les traces d’OpenTelemetry • Metrics -> Trace -> Profile ET ENSUITE ?
  17. 29 Prise de conscience • Combien de temps pour trouver

    la « root cause » ? • Combien d’outils différents ? • Quel effort d’instrumentation ? Commencer par les traces • Comblez les trous • Génération de metrics / logs automatique • Convention de nommage • Intéropérabilité Plateforme unifiée • SaaS ou on-premise ? • Correlation • Experience unifiée • Root-cause analysis CONCLUSION