Temario del curso
Bloques de construcción avanzados para transformaciones
- Trabajar con tipos de datos complejos.
- Gestionar campos, metadatos y estructuras dinámicas.
- Patrones de transformación reutilizables.
Parámetros, variables y diseño orientado a trabajos
- Variables de tiempo de ejecución y ámbitos (scoping).
- Parametrización de transformaciones.
- Estructuras de trabajos padre-hijo.
Integración con bases de datos y estrategias de consulta (lookup)
- Pasos de consulta avanzados.
- Estrategias de caché.
- Diseños eficientes de uniones (joins).
Trabajando con archivos, APIs y sistemas externos
- Procesamiento de JSON y XML.
- Llamadas a servicios REST y SOAP.
- Cargas por streaming y por lotes.
Gestión de errores y técnicas de calidad de datos
- Captura y enrutamiento de errores.
- Patrones de validación de datos.
- Auditoría y registro de eventos (logging).
Fundamentos del ajuste de rendimiento
- Optimización del diseño de pasos.
- Consideraciones sobre memoria e hilos (threading).
- Detección de cuellos de botella.
Introducción al desarrollo basado en repositorios
- Uso del repositorio de Pentaho.
- Gestión de versiones.
- Prácticas de colaboración en equipo.
Prácticas de despliegue y migración
- Promoción de trabajos entre entornos.
- Gestión de configuraciones.
- Mejores prácticas operativas.
Resumen y próximos pasos
Requerimientos
- Comprensión de los fundamentos de ETL.
- Experiencia previa con Pentaho Data Integration.
- Conocimientos básicos de conceptos de almacenamiento de datos (data warehousing).
Público objetivo
- Desarrolladores de ETL.
- Ingenieros de datos.
- Profesionales técnicos que deseen ampliar sus habilidades en PDI.
Testimonios (3)
Que fue muy priactico.
Alfonso Ramos - Banco de Mexico
Curso - Fundamentos de Integración de Datos Pentaho
Muy útil porque me ayuda a entender qué podemos hacer con los datos en nuestro contexto. También me ayudará a
Nicolas NEMORIN - Adecco Groupe France
Curso - KNIME Analytics Platform for BI
Traducción Automática
Es una sesión práctica.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Curso - Talend Open Studio for ESB
Traducción Automática