Temario del curso
Introducción
- Apache Spark vs Hadoop MapReduce
Descripción general de las características y arquitectura de Apache Spark
Selección del lenguaje de programación
Configuración de Apache Spark
Creación de una aplicación de ejemplo
Selección del conjunto de datos
Ejecución del análisis de datos
Procesamiento de datos estructurados con Spark SQL
Procesamiento de datos en transmisión con Spark Streaming
Integración de Apache Spark con herramientas de aprendizaje automático de terceros
Uso de Apache Spark para el procesamiento de grafos
Optimización de Apache Spark
Resolución de problemas
Resumen y conclusiones
Requerimientos
- Experiencia con la línea de comandos de Linux
- Conocimiento general sobre procesamiento de datos
- Experiencia de programación en Java, Scala, Python o R
Público objetivo
- Desarrolladores
Testimonios (2)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática