on, how often does your organization deploy code to production or release it to end users? https://pixabay.com/photos/moto-motorcycling-sport-motorcycles-3406328/
you work on, how long does it generally take to restore service when a service incident or a defect that impacts users occurs (unplanned outage) https://pixabay.com/photos/running-marathon-people-sports-6660186/
work on, what percentage of changes to production or released to users result in degraded service and subsequently require remediation? https://pixabay.com/photos/marathon-competition-sports-running-7111384/
visibilidade do Value Stream das equipes e/ou da organização Não há um padrão mínimo Ciclo de Desenvolvimento de Software (Systems Development Life Cycle) Não há um padrão mínimo de Infraestrutura (Ops)
um padrão mínimo de arquitetura de software ou componentes* Não há incentivo pela liderança de tecnologia em olhar indicadores e métricas de engenharia de software Baixa autonomia para coletar as dados para 4 Keys Metrics
MTTR Deploy a cada 15 dias 102 dias para o primeiro release para um cliente Alto acoplamento entre os serviços Sobrecarga de trabalho em parte da equipe
para nova funcionalidade Implementação de CI/CD automatizado Roadmap de desenvolvimento dos componentes da plataforma “Framework” Migrations Implementação de observabilidade (Distributed Tracing)
Development Gerenciamento visual (Kanban) Redistribuição da carga de trabalho para toda equipe Postmortem Premissas ◦ Tornar o onboading mais rápido de novos clientes ◦ Diminuir o Lead Time de novas funcionalidades ◦ Visibilidade de custos por cliente
o primeiro release para um cliente MTTR == 90 minutos Lead Time for Changes => Ondemand Deploy Frequency => + 1 por dia 25 milhões de reais na rodada de investimento De 11 para 41 itens do backlog em 30 dias com 80% de certeza
Arquitetura e stack “viável” baseado no conhecimento da equipe ◦ Containers, Django, PostgreSQL, Nextjs, IaC ◦ CI/CD ◦ Testes unitários, testes de sistema Dojos para aumentar a cobertura de testes Trunk-Based Development
milhão de usuários em 15 dias Identificado o trabalho em estoque (bloqueado) com um total de +500 dias Implementação da plataforma base de gestão e acompanhamento de performance dos estudantes
Frameworks Internal Developer Platform Implementação de guard-rails padronizados Desenvolvimento de uma Plataforma de CI/CD Padronização da observabilidade
facilmente? Consegue utilizar elas com outros indicadores? ◦ Cycle Time ◦ Blocked Time ◦ Work Item Age ◦ Percentual de trabalho não planejado ◦ Bugs/Defeitos que geram incidentes em produção Qual a dívida técnica principal da organização? Tem mapeado os processos atuais?
processos, automoções, e funcionalidade As hipóteses e decisões são baseadas em dados? A organização entende (evolução) que hoje está melhor que ontem?