Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Aprendendo com os erros
Search
Labcodes Software Studio
October 20, 2018
Programming
3
150
Aprendendo com os erros
Técnicas de como resolver erros em produção e como evitar que eles aconteçam
Labcodes Software Studio
October 20, 2018
Tweet
Share
More Decks by Labcodes Software Studio
See All by Labcodes Software Studio
Sua aplicação web aguenta o tranco?
labcodes
0
13
Como Gerenciar Trocas de Contexto em tempo de Pandemia
labcodes
0
41
Débito Técnico: Porque isso vai estragar teu Software
labcodes
1
320
80 tiros não são disparados por engano
labcodes
0
57
Recompose - O lodash para React
labcodes
2
76
Usando recursos avançados da ORM do Django para consultas mais eficientes
labcodes
2
230
Making smarter queries with advanced ORM resources
labcodes
2
170
Explorando QuerySets do Django
labcodes
2
180
O que desenvolvedores deveriam aprender sobre design
labcodes
0
250
Other Decks in Programming
See All in Programming
Content Security Policy入門 セキュリティ設定と 違反レポートのはじめ方 / Introduction to Content Security Policy Getting Started with Security Configuration and Violation Reporting
uskey512
1
480
AI時代におけるSRE、 あるいはエンジニアの生存戦略
pyama86
4
990
C#/.NETのこれまでのふりかえり
tomokusaba
1
180
WebフロントエンドにおけるGraphQL(あるいはバックエンドのAPI)との向き合い方 / #241106_plk_frontend
izumin5210
4
1.3k
破壊せよ!データ破壊駆動で考えるドメインモデリング / data-destroy-driven
minodriven
17
4.3k
Ethereum_.pdf
nekomatu
0
370
Nurturing OpenJDK distribution: Eclipse Temurin Success History and plan
ivargrimstad
0
460
僕がつくった48個のWebサービス達
yusukebe
20
17k
CPython 인터프리터 구조 파헤치기 - PyCon Korea 24
kennethanceyer
0
250
A Journey of Contribution and Collaboration in Open Source
ivargrimstad
0
460
Tauriでネイティブアプリを作りたい
tsucchinoko
0
350
Importmapを使ったJavaScriptの 読み込みとブラウザアドオンの影響
swamp09
4
1.3k
Featured
See All Featured
What's new in Ruby 2.0
geeforr
343
31k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
A Modern Web Designer's Workflow
chriscoyier
693
190k
YesSQL, Process and Tooling at Scale
rocio
168
14k
Designing on Purpose - Digital PM Summit 2013
jponch
115
7k
Designing for humans not robots
tammielis
249
25k
For a Future-Friendly Web
brad_frost
175
9.4k
Practical Orchestrator
shlominoach
186
10k
Building Adaptive Systems
keathley
38
2.3k
The Cost Of JavaScript in 2023
addyosmani
45
6.7k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
131
33k
Transcript
None
Quem sou? Luiz Braga github.com/luizbraga Cientista da Computação pela UFRPE
Desenvolvedor na Labcodes Ex-malabarista Defensor de Azeroth nas horas vagas
Aprendendo com os erros
O que veremos? • Pânico em produção • Testes falhando
• Falta de monitoramento • Uns macacos loucos
Era uma vez...
Primeira semana Usuários recebendo Erro 500 em ação específica Planejamento
de nova funcionalidade Não sabemos o que os usuários acessam
Segunda semana O erro 500 continua Não conseguimos reproduzir o
erro Alguns usuários reclamam que não estão recebendo email
Terceira semana O erro 500 continua Usuários continuam sem receber
email Tela de detalhes demorando para carregar Final de sprint, nova funcionalidade foi criada
Quarta semana O erro 500 continua, junto com o erro
de email Tela demorando para carregar O desenvolvedor mais experiente entrou de férias De repente, todos os dados da tabela sumiram!
None
O que poderia ajudar?
Parando o sangramento
Primeira semana Usuários recebendo Erro 500 em ação específica Planejamento
de nova funcionalidade Não sabemos o que os usuários acessam
Parar o sangramento • Erro 500 ◦ Error tracking •
Não sabemos o que os usuários acessam ◦ Rastreamento de ação
Error Tracking • Sentry ◦ sentry.io ◦ github.com/getsentry/sentry-python https://docs.sentry.io/platforms/python/django/
Django Log Request ID Rastreamento de requests do usuário Criação
de ID por sessão de usuário github.com/dabapps/django-log-request-id
Segunda semana O erro 500 continua Não conseguimos reproduzir o
erro Alguns usuários reclamam que não estão recebendo email
Parar o sangramento • Usuários não recebendo email ◦ Tarefa
atômica ◦ Boas práticas de tarefas assíncronas
Tarefas atômicas
Terceira semana O erro 500 continua Usuários continuam sem receber
email Tela de detalhes demorando para carregar Final de sprint, nova funcionalidade foi criada
Parar o sangramento • Tela demorando para carregar ◦ Melhoria
nas queries do Django ◦ Paginação ◦ Indexação? ◦ Cache
Django select_related Fetch em um único batch todos os dados
de relacionamento Utilizado para 1-N e 1-1 Não precisa consultar no banco toda vez que precisar de dados do relacional https://docs.djangoproject.com/pt-br/2.1/ref/models/querysets/#select-related
Django prefetch_related Similar ao select_related Utilizado para N-N e N-1
Diminuição da quantidade de consultas feitas no banco https://docs.djangoproject.com/pt-br/2.1/ref/models/querysets/#prefetch-related
Indexação • Diminuição utilização de recurso • Melhor tempo de
resposta • Exemplo: ◦ Updates no MongoDB sem index
Quarta semana O erro 500 continua, junto com o erro
de email Tela demorando para carregar O desenvolvedor mais experiente entrou de férias De repente, todos os dados da tabela sumiram!
Parar o sangramento • Todos os dados da tabela foram
deletados ◦ Backup! ◦ Criação de réplicas ◦ EBS • Sem backup ainda tem esperança
Melhorias • Nova funcionalidade criada ◦ Ambiente de QA •
O desenvolvedor mais experiente entrou de férias ◦ Compartilhar experiência
Compartilhar experiência • Independência do time • Revisão de Pull
Request é uma ótima prática • Evolução do processo
Melhorias • Criação de novos logs • Persistência de Log
◦ AWS: CloudWatch ◦ NoSQL Database ◦ Log file • Extração de valores do log
Deve-se sempre buscar a melhoria
E se tudo estiver bem?
Teste! Sistemas são caóticos! Procure sempre chegar no limite Há
sempre uma melhoria para ser feita
Simule! • Simulação falhas no sistema • Crazy Monkey ◦
E se o banco for deletado? ◦ E se o deploy automático não funcionar? ◦ E se o github parar?
Por que fazer isso? • Aprendizado a partir dos erros
• Evolução do projeto ◦ Melhoria do processo ◦ Qualidade! • O erro humano NUNCA é a causa raiz
Como implementar tudo isso?
Comece pelo começo • Mudança de cultura é difícil •
Pequenos passos ◦ Entenda sua dor ◦ Criação de log mais detalhado já é um início • Vinta Software Dev Checklist ◦ devchecklists.com
Boilerplate em Django github.com/luizbraga/django-monitoring-boilerplate
Full-stack Developers lab.codes/devpleno Newsletter bit.ly/labcodesnews