Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Meetup 3 2019 - Fernando Ficoseco - uServices y SRE en Digital Banking

ArqConf
August 15, 2019

Meetup 3 2019 - Fernando Ficoseco - uServices y SRE en Digital Banking

ArqConf

August 15, 2019
Tweet

More Decks by ArqConf

Other Decks in Technology

Transcript

  1. Muchos problemas Desconocimiento de cómo operar cluster Kubernetes. Poca Robustez,

    Falta de Conocimiento, Mucho Devops poca Time to Market, 200+ Devs desplegando sobre el PaaS, falta de recursos (CPU/Mem/Disco)
  2. #1 Storage NFS vs GlusterFS Simplicidad de Instalación Automatic PV

    / PVC Tecnología Legacy RHEL Support Servidores Listos HA & Reliability Problema: Discos presentados. Tier de vSphere Driver de presentación de discos en vSphere (iSCSI) SSD vs HDD
  3. #2 Integración de Redes Problema: Manejo de vIP Rutas por

    App Certificados SSL F5 - Full Proxy
  4. #3 CICD Problema: How-To CICD Poco expertise en Jenkins, Nexus,

    Sonar Integración de dos procesos actualmente separados Opciones presentadas: • Deploy Custom Jenkins vs Oferta RHEL • Dentro o fuera de OCP • Desarrollo Pipelines y Build Configs • Implementación de Triggers automatizados
  5. #4 Seguridad & Compliance Problema: Control de Accesos IAM AD

    <-> OCP Opciones presentadas: • Manifest controlados • Coordinacion AD • Federación de Usuarios • RBAC en OCP • IAM en aplicativos internos de OCP • Tiempo de almacenamiento de datos
  6. #5 Registry & IS Problema: Image Registry Registry desconectada de

    OCP Imagenes (DockerFiles) Utilizadas Opciones presentadas: • CICD <-> REGISTRY • Chequeo de CVE/Security/Issues de Docker Images • Change Management de Deploys • S2I
  7. #6 Monitoreo - OnCall Problema: Alertas específicas y útiles por

    proyecto Tiempo de respuesta SLA / SLO Observabilidad y Entendimiento (EFK) Propuestas: • AlertManager + Grafana + Prometheous • Métricas “Utiles” • KubeOps • PagerDuty • Shipping de Logs internos del cluster • Capacitación en Flujo de datos
  8. #7 Estabilidad Infra Problema: Método de despliegue de Infra Irregularidades

    de Configuración Automatización Solución: • Golden Images • Implementación de Ansible • Automatización VMware • VM
  9. #8 WAF & Antivirus Problema: Necesidad del WAF ? Incompatibilidad

    de WAF con OCP Configuración Antivirus y Agentes de escaneo (Nessus) Solución: • Configuración óptima de WAF con OCP • Antivirus Legacy / No Configurado / Recursos
  10. #9 Falta de trazabilidad & automatización SRE Problema: Falta de

    trazabilidad y control de versiones No se puede escalar Configuraciones a mano y por host Solución: • Terraform & Ansible • Source Control • Encriptado de Credenciales • “Ensobrado” Moderno
  11. #10 Onboarding de nuevos Proyectos Problema: Onboarding Responsabilidades de grupos

    (proceso y change management) Solución: • Ansible en OCP - LDAP - Jenkins • Change Management de Onboarding de proyectos • Trazabilidad de creaciones
  12. Que encontramos Estado de la plataforma Cantidad / Tecnología de

    Clusters Métodos de Installation Carga Monitoreo Trazabilidad IAM Change Management NO Proceso de CICD Métodos de Despliegue Problemas a Solucionar Básicamente todos los anteriores Hipótesis y Objetivos Estabilidad → Autonomia entre SRE y SRO → Filosofia DevopLess
  13. Lab Dev Homo Prod DMZ Clusters OCP - 3.0 -

    3.11 - 4.1 PaaS IaaS Que tenemos hoy? (Con que arrancamos) Idea N N N x 3 N N/Z
  14. Hybrid DC • VMware vSphere • Golden Images • OS

    Nodos • Automated Launch • Actualizaciones / Patching • Self healing • Automáticamente expandible • Storage Performance DC +
  15. • OCP vs K8S Paquete Cerrado Installation Manual Limitaciones Networking

    / Redes Plugins OCP Red Hat® OpenShift® es una plataforma de contenedores de Kubernetes empresarial con operaciones automatizadas integrales para gestionar implementaciones de nube híbrida y multcloud Digital Banking —> Change Management —> Control y Trazabilidad ante errores —> Poco Compatible con Open Source