Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
InfluxDB + Grafana
Search
Celso Crivelaro
July 08, 2016
Technology
0
250
InfluxDB + Grafana
InfluxDB + Grafana: Telemetria na sua plataforma.
Celso Crivelaro
July 08, 2016
Tweet
Share
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Sistemas de Recomendação
celsocrivelaro
2
210
Big Data para Gerentes de Projetos
celsocrivelaro
0
45
FileSystems em Ruby com FUSE
celsocrivelaro
2
57
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
400
Projeto de APIs
celsocrivelaro
0
140
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
350
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
79
Actor Model in Ruby
celsocrivelaro
0
240
Separando as regras de negócios do Rails
celsocrivelaro
0
180
Other Decks in Technology
See All in Technology
バクラクのドキュメント解析技術と実データにおける課題 / layerx-ccc-winter-2024
shimacos
2
1k
Oracle Cloudの生成AIサービスって実際どこまで使えるの? エンジニア目線で試してみた
minorun365
PRO
4
270
Wvlet: A New Flow-Style Query Language For Functional Data Modeling and Interactive Data Analysis - Trino Summit 2024
xerial
1
110
あの日俺達が夢見たサーバレスアーキテクチャ/the-serverless-architecture-we-dreamed-of
tomoki10
0
420
Turing × atmaCup #18 - 1st Place Solution
hakubishin3
0
470
Storage Browser for Amazon S3
miu_crescent
1
130
サイバー攻撃を想定したセキュリティガイドライン 策定とASM及びCNAPPの活用方法
syoshie
3
1.2k
LINEヤフーのフロントエンド組織・体制の紹介【24年12月】
lycorp_recruit_jp
0
530
2024年にチャレンジしたことを振り返るぞ
mitchan
0
130
kargoの魅力について伝える
magisystem0408
0
200
ハイテク休憩
sat
PRO
2
120
Password-less Journey - パスキーへの移行を見据えたユーザーの準備 @ AXIES 2024
ritou
3
1.4k
Featured
See All Featured
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
2
160
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.7k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
It's Worth the Effort
3n
183
28k
Scaling GitHub
holman
458
140k
Typedesign – Prime Four
hannesfritz
40
2.4k
Making the Leap to Tech Lead
cromwellryan
133
9k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
A Philosophy of Restraint
colly
203
16k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
169
50k
Transcript
InfluxDB + Grafana Telemetria na sua plataforma Celso Crivelaro @celsocrivelaro
DEVELOPER @
None
None
Por quê?
Crise da Plataforma
"O software está lento..."
None
Healthcheck OK! Logs OK! Testes manuais OK!
Corrigimos o problema, mas ainda ficou a falta de visibilidade…
Healthcheck: OK / NOK Não tínhamos números dos tempos da
plataforma Era muito difícil perceber tendências e casos estranhos Logs apenas mostram operações Clientes percebiam problemas antes da gente
1a IDEIA Fazer um teste de carga
Dev / QA / Produção Diferentes Não dá para quebrar
Produção Iria querer muito tempo de dev/ops O número iria mostrar apenas o teto da plataforma
2a IDEIA Monitorações das máquinas
Monitoramento de memória / carga / disco / filas As
máquinas estavam OK, a app não Qualquer variação da métrica causava alvoroço
3a IDEIA Telemetria
Inspirações
None
None
https://www.youtube.com/watch?v=czes-oa0yik
Com o quê?
App influxdb-ruby influxdb-python
Série Temporal SQL Like / Schemaless Boa documentação Funções nativas
com tempo
Estrutura do dado
Equivale a uma tabela SQL Chave primária Time Measurement Values
Tags Chaves-valor da medida, não indexados Metadados indexados, sempre strings cpu_load load=30,temperature=50 server=name1,region=EMEA POINT
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
Funções
count percentil sum mean top max derivative difference moving_average Aggregations
Selectors Transformations
Funções de tempo
> SELECT * FROM messages where time < now() -
1h
Várias bases Gráficos + Plugins
None
Como representar os dados?
Série Temporal Padrões Média de 1 min Valores Absolutos Valores
Absolutos Série Temporal
Percentil -> Para tempo e medidas Percentil 95%
Percentil 95% Média (1 min) Percentil x Média
None
None
Obrigado! @celsocrivelaro http://crivelaro.me