Programa del Curso
Introducción
Descripción general de los enfoques de acceso a datos (Hive, bases de datos, etc.)
Información general sobre las características y la arquitectura de Spark
Instalación y configuración de Spark
Descripción de los marcos de datos en Spark
Definición de tablas e importación de conjuntos de datos
Consulta de marcos de datos mediante SQL
Realización de agregaciones, JOINs y consultas anidadas
Carga y Accessing de datos
Consulta de diferentes tipos de datos
- JSON, Parquet, etc.
Consulta de lagos de datos con SQL
Solución de problemas
Resumen y conclusión
Requerimientos
- Experiencia con SQL consultas
- Experiencia en programación en cualquier lenguaje
Audiencia
- Analistas de datos
- Científicos de datos
- Ingenieros de datos
Testimonios (5)
Un montón de ejemplos prácticos, diferentes formas de abordar un mismo problema, y a veces trucos no tan obvios de cómo mejorar la solución actual
Rafal - Nordea
Curso - Apache Spark MLlib
Traducción Automática
Suficiente práctica, el instructor es conocedor
Chris Tan
Curso - A Practical Introduction to Stream Processing
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
La máquina virtual que me gustó mucho El profesor era muy conocedor sobre el tema así como otros temas, fue muy amable y agradable Me gustó la instalación en Dubái.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
Traducción Automática
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Curso - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Traducción Automática