Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Dominando el Caos en Cargas de Trabajo Sin Serv...

Dominando el Caos en Cargas de Trabajo Sin Servidores

La ingeniería del caos implica provocar intencionalmente interrupciones en las cargas de trabajo, generalmente en servidores tradicionales. En esta charla, exploraremos técnicas para aplicar eficazmente este enfoque en entornos sin servidor. Analizaremos la creación de experimentos de caos que ponen a prueba la resiliencia de sus aplicaciones sin servidor e interpretaremos los resultados para mejorar su solidez y disponibilidad. También cubriremos herramientas específicas y mejores prácticas para entornos sin servidor, lo que ayudará a predecir y prevenir posibles fallas antes de que afecten ambientes de producción.

Avatar for Franchesco romero

Franchesco romero

April 02, 2026
Tweet

More Decks by Franchesco romero

Other Decks in Programming

Transcript

  1. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Dominando el Caos en Cargas de Trabajo Sin Servidores Franchesco Romero DEV 202 AWS Community Builder & AWS User Group Leader
  2. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. La ingeniería del caos es la práctica de introducir fallos intencional y proactivamente en un sistema para identificar y solucionar debilidades © 2024 Amazon Web Services, Inc. o sus empresas afiliadas. Todos los derechos reservados.
  3. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Importancia Mejorar resiliencia Mejorar experiencia de usuario Incrementar disponibilidad Mejorar confianza
  4. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Realice experimentos de caos con regularidad en entornos que estén en producción o lo más cerca posible de ella para entender cómo responde su sistema a condiciones adversas REL12-BP05 - Well Architected Framework © 2024 Amazon Web Services, Inc. o sus empresas afiliadas. Todos los derechos reservados.
  5. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Pre-requisitos Contar con pruebas Conocer Arquitectura Determinar Alcances y Riesgos Entornos Dedicados Monitoreo y Observabilidad
  6. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Ciclo del Caos *
  7. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Diseño de Experimentos Estado Estable Definición y Ejecución Hipótesis Monitoreo y Análisis Determinar la operación normal: KPIs Describir el comportamiento esperado bajo estrés Especificar tipos de fallo, sistemas a probar, así como condiciones Verificar los KPIs y desviaciones del estado estable
  8. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Ejemplo de Experimento Dado: API Gateway multi-región con funciones AWS Lambda detrás de un enrutamiento basado en latencia. Hipótesis: La inyección de latencia en un servicio no debería afectar el rendimiento de otras regiones. Route 53 detecta el aumento de latencia y redirige el tráfico a una región más saludable.
  9. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Ejemplo de Experimento 1. Acción: Inyectar latencia en Lambda. 2. Objetivo: Funciones Lambda en una región específica. 3. Condiciones: Monitorear métricas de latencia en CloudWatch.
  10. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Técnicas y Herramientas
  11. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Técnicas de Inyección de Fallos Resiliencia de Red Latencia en respuestas Pérdida de paquetes Interrupciones Servicios no disponibles Respuestas no esperadas Límites Uso de APIs Memoria Tiempo de ejecución
  12. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Técnicas de Inyección de Fallos Código Ambiente Configuración
  13. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Generando Caos en AWS Característica AWS FIS Chaos Toolkit Chaos_lambda Failure Lambda ⚙ Uso 🔧 Fallos AWS 🛠 Caos en Entornos 🔧 Fallos en Lambda (Runtime) 🔧 Fallos en Lambda (Código) 👍 Facilidad 🔝 Alta ↔ Media ↔ Media ↔ Media 📚 Docs 🌟 Excelente 📖 Bueno 📉 Limitado 📉 Limitado 💰 Costo 💵 Pago por uso 💸 Gratuito 💸 Gratuito 💸 Gratuito
  14. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. AWS Fault Injection Service • Servicio 100% manejado e integrado • Programable: ◦ Consola, AWS CLI, AWS CDK • Experimentos controlados ◦ En secuencia ◦ Paralelos • A todos los niveles ◦ Red, infra, etc
  15. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. AWS Fault Injection Service • Componentes ◦ Plantillas de Experimento ◦ Acciones ◦ Objetivos ◦ Condiciones de paro
  16. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. AWS Fault Injection Service • Fallos Disponibles para Entornos sin Servidores: ◦ DynamoDB no responde ◦ Una región completa no funciona ◦ AWS Lambda tarda mucho en responder ◦ AWS Lambda responde con error ◦ Limitación uso de API
  17. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. AWS FIS - Monitoreo • Integración con AWS CloudWatch • AWS X-Ray para Rastreo • Dashboards Personalizados
  18. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Implementación de AWS FIS para Lambda
  19. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Chaos Toolkit
  20. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Chaos Injection Lambda Layers
  21. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. chaos-lambda-extension
  22. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Técnicas de Resiliencia en AWS
  23. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Aplicaciones Sin Servidor con Tolerancia a Fallos Redundancia Múltiples instancias de componentes críticos Degradación elegante Mantener funcionalidad parcial cuando los componentes fallen Recuperación automatizada Automatizar procesos y flujos de recuperación de fallos
  24. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Técnicas de Resiliencia en AWS Lógica de reintento Reducción exponencial de las llamadas a la API para manejar fallas transitorias
  25. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Técnicas de Resiliencia en AWS Interruptores Automáticos Detener temporalmente las operaciones después de fallas repetidas
  26. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Técnicas de Resiliencia en AWS Límites Evitar la sobrecarga de los servicios, garantizando estabilidad bajo cargas elevadas
  27. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Mejores Prácticas Comenzar pequeño Comunicar Automatizar Monitorear de cerca Documentar
  28. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Resumen
  29. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Resumen • Ingeniería del caos como necesidad • Integración de AWS FIS • Monitoreo y análisis • Técnicas y Herramientas • Mejora continua y colaboración
  30. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. Cree más allá skillbuilder.aws Cree una cuenta gratis en AWS Skill Builder para adquirir las habilidades más demandadas
  31. © 2024 Amazon Web Services, Inc. o sus empresas afiliadas.

    Todos los derechos reservados. ¡Gracias! Complete la encuesta de la sesión en la aplicación móvil Franchesco Romero @elchesco linkedin.com/in/elchesco