DevOps & Site Reliability Engineering com Victor Bogo

DevOps & Site Reliability Engineering 1

2 Victor Silveira Bogo SRE @ @B0go @victorbogo [email protected]

Aplicações desktop 3

E surge a internet 4

5 Aplicações para todo o lado

9 Desenvolvimento de software tradicional developers operators software

10 developers operators - novas funcionalidades o mais rápido possível
- foco no código - quanto menos mudança mais estável - foco na infraestrutura Desenvolvimento de software tradicional

código novo === problemas novos 11 developers operators pq tanto
tempo para o deploy? Desenvolvimento de software tradicional

12 developers operators Nada produtivo Desenvolvimento de software tradicional Agilidade
Estabilidade

13 DevOps cargo- cultura

‘‘ 14 …DevOps é a combinação de ﬁlosoﬁas culturais, práticas
e ferramentas que aumentam a capacidade de uma empresa de distribuir aplicativos e serviços em alta velocidade… (AWS) DevOps

15 DevOps acabar com os silos aceitar falhas mudanças graduais
automação monitoramento Pilares

16 DevOps

17 Confiabilidade? A capacidade de ser confiável - Se o
sistema não fica no ar, ele se torna menos confiável - Se o sistema apresenta muitos erros, ele se torna menos confiável - Se o sistema não é confiável, seus usuário não vão contar com ele - Se os usuário não contarem com o sistema, eles tendem a não usar

18 Exemplo Uber - Você está saindo de uma festa
as 4h da manhã e precisa ir para casa - Por algum motivo, o Uber não está funcionando e você precisa esperar horas por um Taxi

19 Exemplo Uber 5X

20 Exemplo Google GSuite - Você gerencia uma empresa com
500 funcionários - Por um problema técnico, o G Suite ﬁca fora do ar por 3 horas - Ninguém consegue ler e-mail, utilizar o calendário nem gerenciar documentos no Google Drive

21 Confiabilidade? A capacidade de ser confiável Uma das maiores
conquistas do Google foi ele ser tão confiável que as pessoas passaram a acessar ele para saber se a internet estava funcionando

22 Site Reliability Engineering Esperança não é uma estratégia

23 Site Reliability Engineering https://landing.google.com/sre/books/

25 Site Reliability Engineering

26 Monitoramento + SLI e SLO SLI = Service Level
Indicator = Indicador a nível de serviço SLO = Service Level Objective = Objetivo a nível de serviço

27 SLI = Service Level Indicator = Indicador a nível
de serviço Monitoramento + SLI e SLO

28 Monitoramento + SLI e SLO SLO = Service Level
Objective = Objetivo a nível de serviço SLI < 50

Objective = Objetivo a nível de serviço SLO = SLI < 50 SLI = 30 Error Budget = 20

Objective = Objetivo a nível de serviço SLO = SLI < 50 SLI = 70 Error Budget = -20

31 Blameless Postmortem

32 Documento vivo sobre um determinado incidente Blameless Postmortem -
Como o problema ocorreu? - Quais foram as causas raizes? - O que podemos fazer para evitar que ele ocorra novamente?

33 BLAMELESS alguém toma uma ação que leva a um
incidente esta pessoa é culpada por isto a pessoa se sente mal e ﬁca com medo um novo incidente ocorre a pessoa não conta sobre ele por medo de ser culpada deixamos de aprender sobre o incidente e melhorar

35 Ferramentas Infraestrutura Nomad Heroku

36 Monitoramento Ferramentas

37 Ferramentas Infra e Conﬁg como código

38 Ferramentas Linguagens de programação

39 Quando a engenharia de software se junta com a
operação - Criação e desenvolvimento de software - Práticas de qualidade de código - Automatização de trabalho repetitivo - Sistemas operacionais - Redes de computadores - Monitoramento

40 Principais skills - Práticas de engenharia de software -
Pensamento analítico - Senso de urgência e autocontrole - Sistemas operacionais https://roadmap.sh/devops

41 Eventos

42 https://www.digitaltrends.com/business/best-tech-jobs/ - 20/05/2020

43 Perguntas?

DevOps & Site Reliability Engineering com Victo...

DevOps & Site Reliability Engineering com Victor Bogo

More Decks by Sistemas para Internet

Other Decks in Programming

Featured

Transcript