Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
InfluxDB + Grafana
Search
Celso Crivelaro
July 08, 2016
Technology
0
250
InfluxDB + Grafana
InfluxDB + Grafana: Telemetria na sua plataforma.
Celso Crivelaro
July 08, 2016
Tweet
Share
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Sistemas de Recomendação
celsocrivelaro
2
210
Big Data para Gerentes de Projetos
celsocrivelaro
0
50
FileSystems em Ruby com FUSE
celsocrivelaro
2
63
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
400
Projeto de APIs
celsocrivelaro
0
150
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
370
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
79
Actor Model in Ruby
celsocrivelaro
0
240
Separando as regras de negócios do Rails
celsocrivelaro
0
180
Other Decks in Technology
See All in Technology
KubeCon + CloudNativeCon Europe 2025 Recap: The GPUs on the Bus Go 'Round and 'Round / Kubernetes Meetup Tokyo #70
pfn
PRO
0
160
ゆるくはじめるSLI・SLO
yatoum
1
120
非同期処理でも分散トレーシングしたい!- OpenTelemetry × Pub/Sub -
phaya72
1
110
地に足の付いた現実的な技術選定から魔力のある体験を得る『AIレシート読み取り機能』のケーススタディ / From Grounded Tech Choices to Magical UX: A Case Study of AI Receipt Scanning
moznion
5
2k
人間性を捧げる生成AI時代の技術選定
yo4raw
1
1k
4社統合におけるマスタデータ管理に立ち向かう / Towards master data management in the four-company integration
carta_engineering
0
310
【Gen-AX】20250514開催_Findyオンラインイベント_技術選定を突き詰める
genax
0
120
The PyArrow revolution in Pandas
reuven
0
130
PCNW20250514(情シスはAIとどう向き合う?事例から学ぶ活用法)
suguru0719
0
110
本番環境への影響リスクが低い Real Application Testing (SQL Performance Analyzer) の実施方法の検討と実践
jri_narita
0
200
encoding/json v2を予習しよう!
yuyu_hf
PRO
1
220
テスト設計、逆から読むとおもしろい──仕様にない“望ましさ”の逆設計
mhlyc
0
200
Featured
See All Featured
Scaling GitHub
holman
459
140k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
14
1.5k
How to Ace a Technical Interview
jacobian
276
23k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
Building Better People: How to give real-time feedback that sticks.
wjessup
368
19k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Designing Experiences People Love
moore
142
24k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Faster Mobile Websites
deanohume
307
31k
Docker and Python
trallard
44
3.4k
The World Runs on Bad Software
bkeepers
PRO
68
11k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
180
53k
Transcript
InfluxDB + Grafana Telemetria na sua plataforma Celso Crivelaro @celsocrivelaro
DEVELOPER @
None
None
Por quê?
Crise da Plataforma
"O software está lento..."
None
Healthcheck OK! Logs OK! Testes manuais OK!
Corrigimos o problema, mas ainda ficou a falta de visibilidade…
Healthcheck: OK / NOK Não tínhamos números dos tempos da
plataforma Era muito difícil perceber tendências e casos estranhos Logs apenas mostram operações Clientes percebiam problemas antes da gente
1a IDEIA Fazer um teste de carga
Dev / QA / Produção Diferentes Não dá para quebrar
Produção Iria querer muito tempo de dev/ops O número iria mostrar apenas o teto da plataforma
2a IDEIA Monitorações das máquinas
Monitoramento de memória / carga / disco / filas As
máquinas estavam OK, a app não Qualquer variação da métrica causava alvoroço
3a IDEIA Telemetria
Inspirações
None
None
https://www.youtube.com/watch?v=czes-oa0yik
Com o quê?
App influxdb-ruby influxdb-python
Série Temporal SQL Like / Schemaless Boa documentação Funções nativas
com tempo
Estrutura do dado
Equivale a uma tabela SQL Chave primária Time Measurement Values
Tags Chaves-valor da medida, não indexados Metadados indexados, sempre strings cpu_load load=30,temperature=50 server=name1,region=EMEA POINT
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
Funções
count percentil sum mean top max derivative difference moving_average Aggregations
Selectors Transformations
Funções de tempo
> SELECT * FROM messages where time < now() -
1h
Várias bases Gráficos + Plugins
None
Como representar os dados?
Série Temporal Padrões Média de 1 min Valores Absolutos Valores
Absolutos Série Temporal
Percentil -> Para tempo e medidas Percentil 95%
Percentil 95% Média (1 min) Percentil x Média
None
None
Obrigado! @celsocrivelaro http://crivelaro.me