Temario del curso
Introducción
Comprensión de los grandes datos
Vista general de Spark
Vista general de Python
Vista general de PySpark
- Distribución de datos utilizando el marco de conjuntos de datos distribuidos resilientes
- Distribución de cómputo usando operadores de la API de Spark
Configuración de Python con Spark
Configuración de PySpark
Uso de instancias EC2 de Amazon Web Services (AWS) para Spark
Configuración de Databricks
Configuración del clúster AWS EMR
Aprendiendo los fundamentos de la programación en Python
- Comenzando con Python
- Uso del cuaderno Jupyter
- Uso de variables y tipos de datos simples
- Trabajo con listas
- Uso de instrucciones if
- Uso de entradas de usuario
- Trabajo con bucles while
- Implementación de funciones
- Trabajo con clases
- Trabajo con archivos y excepciones
- Trabajo con proyectos, datos y APIs
Aprendiendo los fundamentos de los DataFrames de Spark
- Comenzando con DataFrames de Spark
- Implementación de operaciones básicas con Spark
- Uso de operaciones groupby y agregadas
- Trabajo con marcas de tiempo y fechas
Realización de un ejercicio de proyecto con un DataFrame de Spark
Comprensión del aprendizaje automático con MLlib
Trabajo con MLlib, Spark y Python para el aprendizaje automático
Comprensión de las regresiones
- Aprendiendo la teoría de la regresión lineal
- Implementación de un código de evaluación de regresión
- Trabajo en un ejercicio de ejemplo de regresión lineal
- Aprendiendo la teoría de la regresión logística
- Implementación de un código de regresión logística
- Trabajo en un ejercicio de ejemplo de regresión logística
Comprensión de bosques aleatorios y árboles de decisión
- Aprendiendo la teoría de métodos de árboles
- Implementación de códigos de árboles de decisión y bosques aleatorios
- Trabajo en un ejercicio de ejemplo de clasificación con bosques aleatorios
Trabajo con agrupamiento K-means
- Comprensión de la teoría del agrupamiento K-means
- Implementación de un código de agrupamiento K-means
- Trabajo en un ejercicio de ejemplo de agrupamiento
Trabajo con sistemas de recomendación
Implementación de procesamiento de lenguaje natural
- Comprensión del procesamiento de lenguaje natural (PLN)
- Vista general de herramientas de PLN
- Trabajo en un ejercicio de ejemplo de PLN
Transmisión de datos con Spark en Python
- Vista general de transmisión de datos con Spark
- Ejercicio de ejemplo de transmisión de datos con Spark
Comentarios finales
Requerimientos
- Habilidades generales de programación
Público objetivo
- Desarrolladores
- Profesionales de TI
- Científicos de Datos
Testimonios (6)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El curso trataba sobre una serie de temas muy complejos y relacionados, y Pablo tiene un conocimiento profundo de cada uno de ellos. A veces, los matices se perdían en la comunicación y/o debido a las presiones de tiempo, lo que posiblemente hizo que las expectativas no se cumplieran del todo por esta razón. También hubo algunos problemas con la configuración de UHG/Azure Databricks, pero Pablo/UHG resolvió estos rápidamente una vez que se hicieron evidentes. Esto para mí demostró un alto nivel de entendimiento y profesionalismo entre UHG y Pablo,
Michael Monks - Tech NorthWest Skillnet
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
Atención individualizada.
ARCHANA ANILKUMAR - PPL
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
Formación práctica..
Abraham Thomas - PPL
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
Las lecciones se impartieron en un cuaderno de Jupyter. Los temas estaban estructurados con una secuencia lógica y ayudaron naturalmente a desarrollar la sesión desde las partes más sencillas hasta las más complejas. Ya soy un usuario avanzado de Python con conocimientos en Aprendizaje Automático, por lo que encontré el curso más fácil de seguir que, posiblemente, algunos de mis compañeros que tomaron el curso de formación. Aprecio que se hayan omitido algunos de los conceptos más elementales y que se haya centrado en los temas más sustanciales.
Angela DeLaMora - ADT, LLC
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática