Contacta con nosotros

Temario del curso

Introducción

Comprensión de los grandes datos

Vista general de Spark

Vista general de Python

Vista general de PySpark

  • Distribución de datos utilizando el marco de conjuntos de datos distribuidos resilientes
  • Distribución de cómputo usando operadores de la API de Spark

Configuración de Python con Spark

Configuración de PySpark

Uso de instancias EC2 de Amazon Web Services (AWS) para Spark

Configuración de Databricks

Configuración del clúster AWS EMR

Aprendiendo los fundamentos de la programación en Python

  • Comenzando con Python
  • Uso del cuaderno Jupyter
  • Uso de variables y tipos de datos simples
  • Trabajo con listas
  • Uso de instrucciones if
  • Uso de entradas de usuario
  • Trabajo con bucles while
  • Implementación de funciones
  • Trabajo con clases
  • Trabajo con archivos y excepciones
  • Trabajo con proyectos, datos y APIs

Aprendiendo los fundamentos de los DataFrames de Spark

  • Comenzando con DataFrames de Spark
  • Implementación de operaciones básicas con Spark
  • Uso de operaciones groupby y agregadas
  • Trabajo con marcas de tiempo y fechas

Realización de un ejercicio de proyecto con un DataFrame de Spark

Comprensión del aprendizaje automático con MLlib

Trabajo con MLlib, Spark y Python para el aprendizaje automático

Comprensión de las regresiones

  • Aprendiendo la teoría de la regresión lineal
  • Implementación de un código de evaluación de regresión
  • Trabajo en un ejercicio de ejemplo de regresión lineal
  • Aprendiendo la teoría de la regresión logística
  • Implementación de un código de regresión logística
  • Trabajo en un ejercicio de ejemplo de regresión logística

Comprensión de bosques aleatorios y árboles de decisión

  • Aprendiendo la teoría de métodos de árboles
  • Implementación de códigos de árboles de decisión y bosques aleatorios
  • Trabajo en un ejercicio de ejemplo de clasificación con bosques aleatorios

Trabajo con agrupamiento K-means

  • Comprensión de la teoría del agrupamiento K-means
  • Implementación de un código de agrupamiento K-means
  • Trabajo en un ejercicio de ejemplo de agrupamiento

Trabajo con sistemas de recomendación

Implementación de procesamiento de lenguaje natural

  • Comprensión del procesamiento de lenguaje natural (PLN)
  • Vista general de herramientas de PLN
  • Trabajo en un ejercicio de ejemplo de PLN

Transmisión de datos con Spark en Python

  • Vista general de transmisión de datos con Spark
  • Ejercicio de ejemplo de transmisión de datos con Spark

Comentarios finales

Requerimientos

  • Habilidades generales de programación

Público objetivo

  • Desarrolladores
  • Profesionales de TI
  • Científicos de Datos
 21 Horas

Número de participantes


Precio por participante

Testimonios (6)

Próximos cursos

Categorías Relacionadas