Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
InfluxDB + Grafana
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Celso Crivelaro
July 08, 2016
Technology
260
0
Share
InfluxDB + Grafana
InfluxDB + Grafana: Telemetria na sua plataforma.
Celso Crivelaro
July 08, 2016
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Sistemas de Recomendação
celsocrivelaro
2
240
Big Data para Gerentes de Projetos
celsocrivelaro
0
70
FileSystems em Ruby com FUSE
celsocrivelaro
2
72
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
440
Projeto de APIs
celsocrivelaro
0
170
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
390
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
89
Actor Model in Ruby
celsocrivelaro
0
270
Separando as regras de negócios do Rails
celsocrivelaro
0
190
Other Decks in Technology
See All in Technology
イベントストーミングとKiroの仕様駆動開発で実現する要件の認識合わせプロセス
syobochim
7
1.1k
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
130
Djangoユーザが知っ得なPostgreSQL機能 - 設計の選択肢を増やす / Djang-use-PostgreSQL
soudai
PRO
0
110
React、まだ楽しくて草
uhyo
7
3.9k
AI フレンドリーなエラー監視を TypeScript で実現する
shinyaigeek
2
250
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
1.1k
Javaコミュニティをもっと楽しむための9箇条
takasyou
0
1.2k
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
0
400
個人の発見を、組織の知恵に 〜生成AI活用を"探索"から"組織の仕組み"へ〜
kintotechdev
2
830
サプライチェーンセキュリティの空白地帯 - 信頼できる”依存性”の未来を考える
rung
PRO
2
650
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
160
トークン数だけでは測れない — Claude Code 組織展開の効果検証から学んだこと
makikub
0
120
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
860
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
350
Evolving SEO for Evolving Search Engines
ryanjones
0
210
A Soul's Torment
seathinner
6
2.9k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
840
Paper Plane (Part 1)
katiecoart
PRO
0
8.3k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
Leo the Paperboy
mayatellez
7
1.8k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Art, The Web, and Tiny UX
lynnandtonic
304
22k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
RailsConf 2023
tenderlove
30
1.5k
Transcript
InfluxDB + Grafana Telemetria na sua plataforma Celso Crivelaro @celsocrivelaro
DEVELOPER @
None
None
Por quê?
Crise da Plataforma
"O software está lento..."
None
Healthcheck OK! Logs OK! Testes manuais OK!
Corrigimos o problema, mas ainda ficou a falta de visibilidade…
Healthcheck: OK / NOK Não tínhamos números dos tempos da
plataforma Era muito difícil perceber tendências e casos estranhos Logs apenas mostram operações Clientes percebiam problemas antes da gente
1a IDEIA Fazer um teste de carga
Dev / QA / Produção Diferentes Não dá para quebrar
Produção Iria querer muito tempo de dev/ops O número iria mostrar apenas o teto da plataforma
2a IDEIA Monitorações das máquinas
Monitoramento de memória / carga / disco / filas As
máquinas estavam OK, a app não Qualquer variação da métrica causava alvoroço
3a IDEIA Telemetria
Inspirações
None
None
https://www.youtube.com/watch?v=czes-oa0yik
Com o quê?
App influxdb-ruby influxdb-python
Série Temporal SQL Like / Schemaless Boa documentação Funções nativas
com tempo
Estrutura do dado
Equivale a uma tabela SQL Chave primária Time Measurement Values
Tags Chaves-valor da medida, não indexados Metadados indexados, sempre strings cpu_load load=30,temperature=50 server=name1,region=EMEA POINT
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
Funções
count percentil sum mean top max derivative difference moving_average Aggregations
Selectors Transformations
Funções de tempo
> SELECT * FROM messages where time < now() -
1h
Várias bases Gráficos + Plugins
None
Como representar os dados?
Série Temporal Padrões Média de 1 min Valores Absolutos Valores
Absolutos Série Temporal
Percentil -> Para tempo e medidas Percentil 95%
Percentil 95% Média (1 min) Percentil x Média
None
None
Obrigado! @celsocrivelaro http://crivelaro.me