Temario del curso

Introducción a la Plataforma Stratio

  • Visión general de la arquitectura de Stratio y sus módulos principales
  • El papel de Rocket e Intelligence en el ciclo de vida de los datos
  • Inicio de sesión y navegación en la interfaz de usuario de Stratio

Trabajando con el Módulo Rocket

  • Ingesta de datos y creación de tuberías
  • Conexión a fuentes de datos y configuración de transformaciones
  • Uso de PySpark para tareas de preprocesamiento en Rocket

Conceptos Básicos de PySpark para Usuarios de Stratio

  • Estructuras de datos y operaciones de PySpark
  • Construcciones de bucles: uso de for, while e if/else
  • Creación de funciones personalizadas con def y su aplicación

Uso Avanzado de Rocket con PySpark

  • Ingesta en tiempo real y transformaciones
  • Uso de bucles y funciones en escenarios por lotes y en tiempo real
  • Mejores prácticas para el rendimiento en tuberías de PySpark

Exploración del Módulo Intelligence

  • Visión general de las características de modelado y análisis de datos
  • Selección, transformación y exploración de funciones
  • El papel de PySpark en el análisis personalizado e insights

Creación de Flujos de Trabajo de Análisis Avanzados

  • Creación de funciones definidas por el usuario (UDFs) en Intelligence
  • Aplicación de condicionales y bucles para lógica de datos
  • Casos de uso: segmentación, agregación y predicción

Implementación y Collaboration

  • Guardar, exportar e implementar flujos de trabajo
  • Colaboración con otros miembros del equipo en Stratio
  • Revisión de la salida e integración con herramientas downstream

Resumen y Próximos Pasos

Requerimientos

  • Experiencia en programación con Python
  • Comprensión de conceptos de análisis de datos o procesamiento de big data
  • Conocimientos básicos de Apache Spark y computación distribuida

Audiencia

  • Ingenieros de datos que trabajan en plataformas basadas en Stratio
  • Analistas o desarrolladores que utilizan los módulos Rocket e Intelligence
  • Equipos técnicos que están transitando a flujos de trabajo con PySpark dentro de Stratio
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (4)

Próximos cursos

Categorías Relacionadas