Contacta con nosotros

Temario del curso

Revisión de los conceptos básicos de Apache Airflow

  • Conceptos fundamentales: DAGs, tareas y operadores
  • Arquitectura y componentes de Airflow
  • Repaso de casos de uso y flujos de trabajo comunes

Optimización del rendimiento de los flujos de trabajo

  • Identificación de cuellos de botella en las tuberías de Airflow
  • Técnicas de optimización a nivel de tarea
  • Aprovechamiento de reintentos de tareas, paralelismo y concurrencia

Gestión de dependencias complejas

  • Definición de dependencias dinámicas en los flujos de trabajo
  • Manejo de flujos de trabajo condicionales y ramificados
  • Uso efectivo de grupos de tareas y sub-DAGs

Funciones avanzadas en Apache Airflow

  • Creación de operadores y conectores personalizados
  • Implementación de sensores para desencadenantes externos
  • Integración de servicios y complementos de terceros

Escalado de las implementaciones de Apache Airflow

  • Enfoques de escalado horizontal y vertical
  • Uso de Celery Executors para ejecución distribuida
  • Mejores prácticas para escalar en entornos de nube

Monitoreo y depuración de flujos de trabajo

  • Configuración de registros y alertas para el monitoreo de flujos de trabajo
  • Uso de la interfaz de usuario y la CLI de Airflow para la resolución de problemas
  • Identificación y resolución de problemas comunes en las implementaciones de Airflow

Seguridad en Apache Airflow

  • Autenticación y control de acceso en Airflow
  • Protección de datos sensibles y configuraciones del entorno
  • Implementación de registros de auditoría para los flujos de trabajo

Casos de uso empresarial y mejores prácticas

  • Diseño de flujos de trabajo robustos para entornos de producción
  • Aprovechamiento de Airflow para ingeniería de datos y tuberías ETL
  • Exploración de estudios de casos reales de implementaciones de Airflow escalables

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de Apache Airflow
  • Familiaridad con la programación en Python y los conceptos de orquestación de flujos de trabajo
  • Experiencia en la gestión y despliegue de aplicaciones en entornos Linux

Público objetivo

  • Ingenieros de datos
  • Profesionales de DevOps
  • Desarrolladores de software
 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas