Temario del curso
Introducción
- Resumen de las características y la arquitectura de Spark y Hadoop
- Comprensión de los grandes datos
- Fundamentos de la programación en Python
Primeros pasos
- Configuración de Python, Spark y Hadoop
- Comprensión de las estructuras de datos en Python
- Comprensión de la API de PySpark
- Comprensión de HDFS y MapReduce
Integración de Spark y Hadoop con Python
- Implementación de RDD de Spark en Python
- Procesamiento de datos mediante MapReduce
- Creación de conjuntos de datos distribuidos en HDFS
Aprendizaje automático con Spark MLlib
Procesamiento de grandes datos con Spark Streaming
Trabajo con sistemas de recomendación
Trabajo con Kafka, Sqoop y Flume
Apache Mahout con Spark y Hadoop
Resolución de problemas
Resumen y próximos pasos
Requerimientos
- Experiencia con Spark y Hadoop
- Experiencia en programación con Python
Público objetivo
- Científicos de datos
- Desarrolladores
Testimonios (3)
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
Me gustó que logró sentar las bases del tema y llegar a algunos ejercicios bastante avanzados. También proporcionó formas sencillas de escribir y probar el código.
Ionut Goga - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática