Contacta con nosotros

Temario del curso

Introducción a la plataforma Stratio

  • Descripción general de la arquitectura de Stratio y módulos principales
  • Papel de Rocket e Intelligence en el ciclo de vida de los datos
  • Inicio de sesión y navegación en la interfaz de usuario (UI) de Stratio

Trabajo con el módulo Rocket

  • Ingesta de datos y creación de pipelines
  • Conexión de fuentes de datos y configuración de transformaciones
  • Uso de PySpark para tareas de preprocesamiento en Rocket

Conceptos esenciales de PySpark para usuarios de Stratio

  • Estructuras y operaciones de datos de PySpark
  • Constructores de bucles: uso de for, while, if/else
  • Escritura de funciones personalizadas con def y su aplicación

Uso avanzado de Rocket con PySpark

  • Ingesta y transformaciones en streaming
  • Uso de bucles y funciones en escenarios por lotes y en tiempo real
  • Mejores prácticas para el rendimiento en pipelines de PySpark

Exploración del módulo Intelligence

  • Descripción general de las características de modelado y análisis de datos
  • Selección, transformación y exploración de características
  • Papel de PySpark en el análisis personalizado e insights

Creación de flujos de trabajo de análisis avanzado

  • Creación de funciones definidas por el usuario (UDF) en Intelligence
  • Aplicación de condicionales y bucles para lógica de datos
  • Casos de uso: segmentación, agregación y predicción

Despliegue y colaboración

  • Guardado, exportación y reutilización de flujos de trabajo
  • Colaboración con otros miembros del equipo en Stratio
  • Revisión de salidas e integración con herramientas de nivel inferior

Resumen y próximos pasos

Requerimientos

  • Experiencia con programación en Python
  • Comprensión de conceptos de análisis de datos o procesamiento de big data
  • Conocimientos básicos de Apache Spark y computación distribuida

Público objetivo

  • Ingenieros de datos que trabajan en plataformas basadas en Stratio
  • Analistas o desarrolladores que utilizan los módulos Rocket e Intelligence
  • Equipos técnicos que migran a flujos de trabajo con PySpark dentro de Stratio
 14 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas