Slide 1

Slide 1 text

DE 0 A SRE EN UN AÑO

Slide 2

Slide 2 text

Pablo Fredrikson @pablokbs ● Principal SRE @ Split Software ● 18 años con Linux ● 10 años con Docker ● 7 años con Kubernetes en Producción ● Yutubuer: Pelado Nerd

Slide 3

Slide 3 text

SRE Site Reliability Engineering

Slide 4

Slide 4 text

Site Reliability Engineering

Slide 5

Slide 5 text

¿Qué hizo Google? https://sre.google/books/

Slide 6

Slide 6 text

¿Por qué aplicar SRE? Dev Ops

Slide 7

Slide 7 text

¿Por qué aplicar SRE? Dev Ops

Slide 8

Slide 8 text

Mi historia como SRE ● Trabajé 6 años en Invision ○ Monolito + Microservicios ○ 2500+ servidores en 15 clusters de Kubernetes ○ 200+ ingenieros ● Entrevisté para Split y me contaron de su infra ○ Monolito + Microservicios ○ Infra tradicional con EC2, terraform ○ Días para hacer deploys ○ Crear un nuevo servicio llevaba ~7 días

Slide 9

Slide 9 text

Mi historia como SRE ● Trabajé 6 años en Invision ○ Monolito + Microservicios ○ 2500+ servidores en 15 clusters de Kubernetes ○ 200+ ingenieros ● Entrevisté para Split y me contaron de su infra ○ Monolito + Microservicios ○ Infra tradicional con EC2, terraform ○ Días para hacer deploys ○ Crear un nuevo servicio llevaba ~7 días

Slide 10

Slide 10 text

● Reducir el tiempo para crear y desplegar servicios ● Dar más control y visibilidad a los desarrolladores ● Hacer despliegues más rápidos y seguidos ● Escalar más rápido y más eficientemente ● Reducir costos ● Al mismo tiempo: No romper nada Objetivos Qué queremos hacer

Slide 11

Slide 11 text

2 1 Create an active flag 2 Send event data 3 Create metrics 4 Use a percentage rollout 5 Understand impact 1 3 4 5 Split: Feature Flags y más

Slide 12

Slide 12 text

Objetivo principal Que sea posible crear un servicio y ponerlo en producción en menos de un día de trabajo, sin interacción humana.

Slide 13

Slide 13 text

Necesitamos un equipo SRE

Slide 14

Slide 14 text

Requisitos para un/a SRE ● Muy bueno/a técnicamente ● Mucha experiencia de la infra actual ● Evangelizador / Educador

Slide 15

Slide 15 text

Proyecto Genesis

Slide 16

Slide 16 text

Proyecto Genesis Algunas fases se solapan!

Slide 17

Slide 17 text

0: Elegir Kubernetes EKS + Argo

Slide 18

Slide 18 text

1: CI/CD Despliegues básicos Concourse, scripts en GH Actions mucho bash

Slide 19

Slide 19 text

2 y 3: Migración y CI/CD Pro Concourse, scripts en GH Actions uso de herramientas solapadas

Slide 20

Slide 20 text

Lens / OpenLens Ayuda a devs a familiarizarse con Kubernetes

Slide 21

Slide 21 text

4: Tunear recursos Ahora a ahorrar un poco

Slide 22

Slide 22 text

Qué logramos y aprendimos ● Costo reducido en 60% en EC2: Los nodos son más eficientes ● Más deploys y más rápidos! ● Crear un servicio y ponerlo en producción usualmente lleva menos de 1 hora desde inicio a final. ○ Esto incluye crear el repo, subir código simple, creando imagen de Docker, ELB, DNS y más ● Desarrolladores se sienten más cómodos con Kubernetes ○ Lens es genial ● DevOps: Se acabó la pelea

Slide 23

Slide 23 text

No se olviden

Slide 24

Slide 24 text

Tus clientes ven un solo equipo

Slide 25

Slide 25 text

GRACIAS peladonerd.com