Temario del curso
Introducción a Apache Spark
- El papel de Spark en el procesamiento de big data
- Arquitectura de Spark y sus componentes
Configuración de Apache Spark
- Requisitos de hardware y software
- Procedimientos de instalación para modo independiente y modo clúster
- Prácticas recomendadas de configuración para administradores de sistemas
Administración de clústeres de Spark
- Herramientas y técnicas de gestión de clústeres
- Monitoreo de aplicaciones de Spark y recursos del clúster
- Configuración de seguridad y gestión de usuarios
Ajuste de rendimiento y optimización
- Asignación de recursos y programación
- Optimización de Spark para un rendimiento óptimo
- Identificación y resolución de cuellos de botella comunes
Resolución de problemas
- Desafíos comunes en la administración de Spark
- Herramientas y técnicas de diagnóstico para la resolución de problemas
- Enfoque paso a paso para resolver problemas comunes
- Mejores prácticas para mantener un entorno de Spark saludable
Temas avanzados de administración
- Integración con otras herramientas de big data
- Garantía de alta disponibilidad y recuperación ante desastres
- Actualización y escalado de clústeres de Spark
Resumen y próximos pasos
Requerimientos
- Conocimientos básicos de configuración y gestión de redes
- Familiaridad con el sistema operativo Linux y la interfaz de línea de comandos
- Interés por aprender sobre sistemas de computación distribuida y gestión de big data
Público objetivo
- Administradores de sistemas
Testimonios (3)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
La combinación de teoría y práctica con herramientas como databricks