Temario del curso
Fundamentos de las Operaciones en la Nube en AWS
- Roles y responsabilidades operativas en la nube.
- Estructura de cuentas de AWS, organizaciones y estrategia de múltiples cuentas.
- Servicios operativos centrales: CloudWatch, CloudTrail y AWS Config.
Infraestructura como Código y Aprovisionamiento
- Principios de IaC e infraestructura inmutable.
- Aprovisionamiento con Terraform y AWS CloudFormation.
- Gestión del estado, módulos y promoción de entornos.
CI/CD y Estrategias de Implementación
- Diseño de pipelines de CI/CD para aplicaciones nativas de la nube.
- Implementaciones azul/verde, canario y progresivas.
- Automatización de retrocesos, verificaciones de salud y validación de lanzamientos.
Monitoreo, Observabilidad y Alertas
- Métricas, registros y trazas: envío, almacenamiento y análisis.
- Uso de CloudWatch, X-Ray y herramientas de observabilidad de terceros.
- Definición de SLO/SLI, políticas de alerta y prácticas de guardia (on-call).
Operaciones de Seguridad y Gestión de Identidad
- Mejores prácticas de IAM, principio de menor privilegio y acceso entre cuentas.
- Gestión de secretos, KMS y almacenes de parámetros seguros.
- Seguridad operativa: estrategias de parcheo, escaneo de vulnerabilidades y registros de auditoría.
Resiliencia, Copias de Seguridad y Recuperación ante Desastres
- Diseño para tolerancia a fallos y alta disponibilidad.
- Estrategias de copia de seguridad, automatización de instantáneas y procedimientos de restauración.
- Planificación de recuperación ante desastres y creación de manuales de operación.
Optimización de Costos y Gobernanza
- Visibilidad de costos: facturación, etiquetado y estrategias de asignación de costos.
- Ajuste de capacidad (rightsizing), instancias reservadas/planes de ahorro y controles presupuestarios.
- Gobernanza: políticas, barreras de protección (guardrails) y automatización para el cumplimiento.
Contenedores, Serverless y Operaciones en Tiempo de Ejecución
- Consideraciones operativas para ECS, EKS y Lambda.
- Descubrimiento de servicios, escalado automático y límites de recursos.
- Registro, trazado y depuración de cargas de trabajo en contenedores.
Respuesta a Incidentes, Manuales y Ingeniería del Caos
- Respuesta a incidentes basada en manuales y prácticas de lecciones aprendidas (postmortem).
- Automatización de patrones de remediación y autosanación.
- Introducción a experimentos de caos para validar la resiliencia.
Taller Práctico: Operación de una Carga de Trabajo de Muestra
- Implementación de una aplicación de muestra usando IaC y un pipeline de CI/CD.
- Implementación de monitoreo, alertas y un script de remediación automatizada.
- Simulación de incidentes y práctica de respuesta basada en manuales.
Resumen y Próximos Pasos
Requerimientos
- Comprensión básica de conceptos de nube y redes.
- Familiaridad con la línea de comandos de Linux y scripting.
- Experiencia con control de fuentes (Git) y conceptos básicos de CI/CD.
Público objetivo
- Ingenieros de operaciones en la nube.
- SRE e ingenieros de plataforma.
- Ingenieros de DevOps y líderes técnicos.
Testimonios (1)
He descubierto cosas nuevas y interesantes sobre Lambda y Serverless
Oleg Buldumac - PUBLIC COURSE
Curso - AWS Lambda for Developers
Traducción Automática