Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DevOps no iFood - Como é o nosso dia a dia
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Eduardo
April 03, 2019
540
1
Share
DevOps no iFood - Como é o nosso dia a dia
Eduardo
April 03, 2019
Featured
See All Featured
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
65
55k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
190
Thoughts on Productivity
jonyablonski
76
5.2k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
570
How Software Deployment tools have changed in the past 20 years
geshan
0
34k
Amusing Abliteration
ianozsvald
1
190
Building an army of robots
kneath
306
46k
The agentic SEO stack - context over prompts
schlessera
0
790
Abbi's Birthday
coloredviolet
2
7.8k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
470
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
260
Transcript
DevOps no iFood Como é o nosso dia a dia
Eduardo Ximenes Soares Gerente de TI/SRE
Quem conhece o iFood?
Alguns números...
+17M pedidos/mês +150K pedidos/hora
+17M pedidos/mês +150K pedidos/hora ± 40 pedidos/sec +80 pedidos/sec
+17M pedidos/mês +150K pedidos/hora +80 pedidos/sec ± 40 pedidos/sec +700K
pedidos/dia
+60K restaurantes +500 cidades/BR
+3M pedidos/logística +200K motoboys/ano
+12M usuários +300K usuários/hora
+50k req/s
Desafios do crescimento...
None
None
Tecnologias...
None
None
None
None
CI / CD
~ 300 aplicações escaláveis + 1K instâncias em pico +
300 Deploys Zero Downtime / por semana Multi Region / Multi Account Serverless Kubernetes / Chef / Terraform Resumo
Mas nem tudo são flores...
INFRA
None
PR - Terraform PR - Chef
Slow
Toil
SRE - De onde veio?
A grande necessidade de aproximação do time técnico com o
negócio e o descontentamento dos times de desenvolvimento
SRE - Por onde começamos
Split do time em SRE de Projetos e SRE dentro
dos times de desenvolvimento
SRE - Onde falhamos
Os SRE’s dentro dos time de desenvolvimento estavam afastados dos
projetos e com demandas sem muito desafio técnico
SRE - Como reagimos
TOIL: começamos a verificar e analisar os trabalhos repetitivos e
manuais que consomem grande parte do tempo dos SRE’s
Como: através de nossas Dailys e classificando os eventos em
Low, Medium e High
Low: evento que não afeta, mas é um incômodo Medium:
tarefas que perdemos parte do tempo High: evento que poderia afetar ou afetou plataforma ou o dia a dia dos desenvolvedores
Exemplo Medium Toil: perdemos grande parte do tempo arrumando código
de PR do Terraform Plano de ação: criar pipeline para PR do Terraform
Atualmente os SRE’s atuam praticamente 50% apoiando os times de
desenvolvimento e 50% em projetos para resolver Toil e evoluir os processos de automação
SRE - Não paramos por ai
Todo Toil High é tratado como Error Budget e fazemos
Postmortem
SRE - Próximos passos
SLO SLA Error Budget
Obrigado! Eduardo Ximenes Soares
[email protected]