Contacta con nosotros

Temario del curso

Fundamentos de NiFi y flujos de datos

  • Datos en movimiento vs. datos en reposo: conceptos y desafíos
  • Arquitectura de NiFi: núcleos, controlador de flujos, proveniencia y boletines
  • Componentes clave: procesadores, conexiones, controladores y proveniencia

Contexto e integración de Big Data

  • Rol de NiFi en ecosistemas de Big Data (Hadoop, Kafka, almacenamiento en la nube)
  • Descripción general de HDFS, MapReduce y alternativas modernas
  • Casos de uso: ingestión de flujos, envío de registros, pipelines de eventos

Instalación, configuración y configuración del clúster

  • Instalación de NiFi en modo de nodo único y de clúster
  • Configuración del clúster: roles de los nodos, Zookeeper y balanceo de carga
  • Orquestación de implementaciones de NiFi: uso de Ansible, Docker o Helm

Diseño y gestión de flujos de datos

  • Enrutamiento, filtrado, división y fusión de flujos
  • Configuración de procesadores (InvokeHTTP, QueryRecord, PutDatabaseRecord, etc.)
  • Gestión de esquemas, enriquecimiento y operaciones de transformación
  • Manejo de errores, relaciones de reintento y retroceso (backpressure)

Escenarios de integración

  • Conexión a bases de datos, sistemas de mensajería y APIs REST
  • Transmisión a sistemas de análisis: Kafka, Elasticsearch o almacenamiento en la nube
  • Integración con Splunk, Prometheus o pipelines de registros

Monitoreo, recuperación y proveniencia

  • Uso de la interfaz de usuario de NiFi, métricas y visualizador de proveniencia
  • Diseño de recuperación autónoma y manejo elegante de fallas
  • Copias de seguridad, versionado de flujos y gestión de cambios

Ajuste y optimización del rendimiento

  • Ajuste de JVM, memoria heap, grupos de hilos y parámetros del clúster
  • Optimización del diseño de flujos para reducir cuellos de botella
  • Aislamiento de recursos, priorización de flujos y control de la tasa de transferencia

Mejores prácticas y gobernanza

  • Documentación de flujos, estándares de nomenclatura, diseño modular
  • Seguridad: TLS, autenticación, control de acceso, cifrado de datos
  • Control de cambios, versionado, acceso basado en roles y registros de auditoría

Solución de problemas y respuesta a incidentes

  • Problemas comunes: bloqueos, fugas de memoria, errores de procesadores
  • Análisis de registros, diagnóstico de errores e investigación de causas raíz
  • Estrategias de recuperación y reversión de flujos

Laboratorio práctico: Implementación de una canalización de datos realista

  • Construcción de un flujo de extremo a extremo: ingestión, transformación, entrega
  • Implementación de manejo de errores, retroceso y escalabilidad
  • Prueba de rendimiento y ajuste de la canalización

Resumen y próximos pasos

Requerimientos

  • Experiencia con la línea de comandos de Linux
  • Conocimientos básicos de redes y sistemas de datos
  • Exposición a conceptos de transmisión de datos o ETL

Público objetivo

  • Administradores de sistemas
  • Ingenieros de datos
  • Desarrolladores
  • Profesionales de DevOps
 21 Horas

Número de participantes


Precio por participante

Testimonios (7)

Próximos cursos

Categorías Relacionadas