Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
InfluxDB + Grafana
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Celso Crivelaro
July 08, 2016
Technology
260
0
Share
InfluxDB + Grafana
InfluxDB + Grafana: Telemetria na sua plataforma.
Celso Crivelaro
July 08, 2016
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Sistemas de Recomendação
celsocrivelaro
2
240
Big Data para Gerentes de Projetos
celsocrivelaro
0
70
FileSystems em Ruby com FUSE
celsocrivelaro
2
72
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
440
Projeto de APIs
celsocrivelaro
0
170
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
390
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
89
Actor Model in Ruby
celsocrivelaro
0
270
Separando as regras de negócios do Rails
celsocrivelaro
0
190
Other Decks in Technology
See All in Technology
実装は速くなった、レビューはどうする? ― 自身のレビューをAIで再現させるサーヴァントエンジニアリングのすゝめ / Implementation got faster. So what about reviews? — An invitation to Servant Engineering: Recreating your own code reviews with AI
nrslib
6
3.1k
オンコールの負荷軽減のためのBits Assistant 活用方法 / How to Use Bits Assistant to Reduce the Workload on On-Call Staff
sms_tech
1
380
脅威をエンジニアリングの糧にして:恐怖を乗り越えた先にあったもの / Turn threats into fuel for engineering: what lay beyond overcoming fear
nrslib
1
380
新規ゲーム開発におけるAI駆動開発のリアル
202409e2
0
2.1k
大学生が本気でDatabricksを活用してDiscordサークルをデータ駆動させてみた
phantomjuju
1
340
最低限これだけ押さえれ大丈夫_Claude Enterprise/Team企業展開ガバナンス入門
tkikuchi
1
720
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
38
40k
Terraformモジュールは、なぜ「魔境」化するのか
hayama17
1
180
ルールやカスタム機能、どう使う?理想の出力を引き出すために今知りたいIBM Bob 5つの機能
muehara
1
310
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
230
はじめてのDatadog
kairim0
0
260
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
190
Featured
See All Featured
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
230
Documentation Writing (for coders)
carmenintech
77
5.4k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
240
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
What's in a price? How to price your products and services
michaelherold
247
13k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
The World Runs on Bad Software
bkeepers
PRO
72
12k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
600
A Modern Web Designer's Workflow
chriscoyier
698
190k
Side Projects
sachag
455
43k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
Transcript
InfluxDB + Grafana Telemetria na sua plataforma Celso Crivelaro @celsocrivelaro
DEVELOPER @
None
None
Por quê?
Crise da Plataforma
"O software está lento..."
None
Healthcheck OK! Logs OK! Testes manuais OK!
Corrigimos o problema, mas ainda ficou a falta de visibilidade…
Healthcheck: OK / NOK Não tínhamos números dos tempos da
plataforma Era muito difícil perceber tendências e casos estranhos Logs apenas mostram operações Clientes percebiam problemas antes da gente
1a IDEIA Fazer um teste de carga
Dev / QA / Produção Diferentes Não dá para quebrar
Produção Iria querer muito tempo de dev/ops O número iria mostrar apenas o teto da plataforma
2a IDEIA Monitorações das máquinas
Monitoramento de memória / carga / disco / filas As
máquinas estavam OK, a app não Qualquer variação da métrica causava alvoroço
3a IDEIA Telemetria
Inspirações
None
None
https://www.youtube.com/watch?v=czes-oa0yik
Com o quê?
App influxdb-ruby influxdb-python
Série Temporal SQL Like / Schemaless Boa documentação Funções nativas
com tempo
Estrutura do dado
Equivale a uma tabela SQL Chave primária Time Measurement Values
Tags Chaves-valor da medida, não indexados Metadados indexados, sempre strings cpu_load load=30,temperature=50 server=name1,region=EMEA POINT
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
> SELECT * FROM policy_entry name: policy_entry ------------------ time cache_hit
host success time 1464013724 1 saasauth0005 1 0.35 Fetching data
Funções
count percentil sum mean top max derivative difference moving_average Aggregations
Selectors Transformations
Funções de tempo
> SELECT * FROM messages where time < now() -
1h
Várias bases Gráficos + Plugins
None
Como representar os dados?
Série Temporal Padrões Média de 1 min Valores Absolutos Valores
Absolutos Série Temporal
Percentil -> Para tempo e medidas Percentil 95%
Percentil 95% Média (1 min) Percentil x Média
None
None
Obrigado! @celsocrivelaro http://crivelaro.me