Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Aprendendo com os erros
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Labcodes Software Studio
October 20, 2018
Programming
3
210
Aprendendo com os erros
Técnicas de como resolver erros em produção e como evitar que eles aconteçam
Labcodes Software Studio
October 20, 2018
Tweet
Share
More Decks by Labcodes Software Studio
See All by Labcodes Software Studio
Sua aplicação web aguenta o tranco?
labcodes
0
44
Como Gerenciar Trocas de Contexto em tempo de Pandemia
labcodes
0
85
Débito Técnico: Porque isso vai estragar teu Software
labcodes
1
420
80 tiros não são disparados por engano
labcodes
0
94
Recompose - O lodash para React
labcodes
2
130
Usando recursos avançados da ORM do Django para consultas mais eficientes
labcodes
2
330
Making smarter queries with advanced ORM resources
labcodes
2
250
Explorando QuerySets do Django
labcodes
2
230
O que desenvolvedores deveriam aprender sobre design
labcodes
0
300
Other Decks in Programming
See All in Programming
Redox OS でのネームスペース管理と chroot の実現
isanethen
0
260
AWS×クラウドネイティブソフトウェア設計 / AWS x Cloud-Native Software Design
nrslib
16
3.3k
Go Conference mini in Sendai 2026 : Goに新機能を提案し実装されるまでのフロー徹底解説
yamatoya
0
610
GoのDB アクセスにおける 「型安全」と「柔軟性」の両立 - Bob という選択肢
tak848
0
230
new(1.26) ← これすき / kamakura.go #8
utgwkk
0
2.5k
What Spring Developers Should Know About Jakarta EE
ivargrimstad
0
460
守る「だけ」の優しいEMを抜けて、 事業とチームを両方見る視点を身につけた話
maroon8021
3
1.1k
Symfony + NelmioApiDocBundle を使った スキーマ駆動開発 / Schema Driven Development with NelmioApiDocBundle
okashoi
0
180
OTP を自動で入力する裏技
megabitsenmzq
0
120
RubyとGoでゼロから作る証券システム: 高信頼性が求められるシステムのコードの外側にある設計と運用のリアル
free_world21
0
310
Agentic AI: Evolution oder Revolution
mobilelarson
PRO
0
190
ふつうのRubyist、ちいさなデバイス、大きな一年 / Ordinary Rubyists, Tiny Devices, Big Year
chobishiba
1
480
Featured
See All Featured
Mobile First: as difficult as doing things right
swwweet
225
10k
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.4k
Producing Creativity
orderedlist
PRO
348
40k
GitHub's CSS Performance
jonrohan
1032
470k
The Spectacular Lies of Maps
axbom
PRO
1
630
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
290
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
230
Building Applications with DynamoDB
mza
96
7k
Un-Boring Meetings
codingconduct
0
230
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
It's Worth the Effort
3n
188
29k
The Pragmatic Product Professional
lauravandoore
37
7.2k
Transcript
None
Quem sou? Luiz Braga github.com/luizbraga Cientista da Computação pela UFRPE
Desenvolvedor na Labcodes Ex-malabarista Defensor de Azeroth nas horas vagas
Aprendendo com os erros
O que veremos? • Pânico em produção • Testes falhando
• Falta de monitoramento • Uns macacos loucos
Era uma vez...
Primeira semana Usuários recebendo Erro 500 em ação específica Planejamento
de nova funcionalidade Não sabemos o que os usuários acessam
Segunda semana O erro 500 continua Não conseguimos reproduzir o
erro Alguns usuários reclamam que não estão recebendo email
Terceira semana O erro 500 continua Usuários continuam sem receber
email Tela de detalhes demorando para carregar Final de sprint, nova funcionalidade foi criada
Quarta semana O erro 500 continua, junto com o erro
de email Tela demorando para carregar O desenvolvedor mais experiente entrou de férias De repente, todos os dados da tabela sumiram!
None
O que poderia ajudar?
Parando o sangramento
Primeira semana Usuários recebendo Erro 500 em ação específica Planejamento
de nova funcionalidade Não sabemos o que os usuários acessam
Parar o sangramento • Erro 500 ◦ Error tracking •
Não sabemos o que os usuários acessam ◦ Rastreamento de ação
Error Tracking • Sentry ◦ sentry.io ◦ github.com/getsentry/sentry-python https://docs.sentry.io/platforms/python/django/
Django Log Request ID Rastreamento de requests do usuário Criação
de ID por sessão de usuário github.com/dabapps/django-log-request-id
Segunda semana O erro 500 continua Não conseguimos reproduzir o
erro Alguns usuários reclamam que não estão recebendo email
Parar o sangramento • Usuários não recebendo email ◦ Tarefa
atômica ◦ Boas práticas de tarefas assíncronas
Tarefas atômicas
Terceira semana O erro 500 continua Usuários continuam sem receber
email Tela de detalhes demorando para carregar Final de sprint, nova funcionalidade foi criada
Parar o sangramento • Tela demorando para carregar ◦ Melhoria
nas queries do Django ◦ Paginação ◦ Indexação? ◦ Cache
Django select_related Fetch em um único batch todos os dados
de relacionamento Utilizado para 1-N e 1-1 Não precisa consultar no banco toda vez que precisar de dados do relacional https://docs.djangoproject.com/pt-br/2.1/ref/models/querysets/#select-related
Django prefetch_related Similar ao select_related Utilizado para N-N e N-1
Diminuição da quantidade de consultas feitas no banco https://docs.djangoproject.com/pt-br/2.1/ref/models/querysets/#prefetch-related
Indexação • Diminuição utilização de recurso • Melhor tempo de
resposta • Exemplo: ◦ Updates no MongoDB sem index
Quarta semana O erro 500 continua, junto com o erro
de email Tela demorando para carregar O desenvolvedor mais experiente entrou de férias De repente, todos os dados da tabela sumiram!
Parar o sangramento • Todos os dados da tabela foram
deletados ◦ Backup! ◦ Criação de réplicas ◦ EBS • Sem backup ainda tem esperança
Melhorias • Nova funcionalidade criada ◦ Ambiente de QA •
O desenvolvedor mais experiente entrou de férias ◦ Compartilhar experiência
Compartilhar experiência • Independência do time • Revisão de Pull
Request é uma ótima prática • Evolução do processo
Melhorias • Criação de novos logs • Persistência de Log
◦ AWS: CloudWatch ◦ NoSQL Database ◦ Log file • Extração de valores do log
Deve-se sempre buscar a melhoria
E se tudo estiver bem?
Teste! Sistemas são caóticos! Procure sempre chegar no limite Há
sempre uma melhoria para ser feita
Simule! • Simulação falhas no sistema • Crazy Monkey ◦
E se o banco for deletado? ◦ E se o deploy automático não funcionar? ◦ E se o github parar?
Por que fazer isso? • Aprendizado a partir dos erros
• Evolução do projeto ◦ Melhoria do processo ◦ Qualidade! • O erro humano NUNCA é a causa raiz
Como implementar tudo isso?
Comece pelo começo • Mudança de cultura é difícil •
Pequenos passos ◦ Entenda sua dor ◦ Criação de log mais detalhado já é um início • Vinta Software Dev Checklist ◦ devchecklists.com
Boilerplate em Django github.com/luizbraga/django-monitoring-boilerplate
Full-stack Developers lab.codes/devpleno Newsletter bit.ly/labcodesnews