Contacta con nosotros

Temario del curso

Introducción a los ecosistemas de Big Data

  • Descripción general de las tecnologías y arquitecturas de big data
  • Procesamiento por lotes vs. procesamiento en tiempo real
  • Estrategias de almacenamiento de datos para escalabilidad

Procesamiento avanzado de datos con Apache Spark

  • Optimización de trabajos de Spark para rendimiento
  • Transformaciones y acciones avanzadas
  • Trabajo con transmisión estructurada (structured streaming)

Aprendizaje automático a gran escala

  • Técnicas de entrenamiento de modelos distribuidos
  • Ajuste de hiperparámetros en conjuntos de datos grandes
  • Implementación de modelos en entornos de big data

Aprendizaje profundo para Big Data

  • Integración de TensorFlow y PyTorch con Spark
  • Canales de entrenamiento distribuido de aprendizaje profundo
  • Casos de uso en análisis de imágenes, texto y series temporales

Análisis en tiempo real y transmisión de datos

  • Apache Kafka para ingestión de datos en streaming
  • Marcos de procesamiento de flujos (stream processing)
  • Monitoreo y alertas en sistemas en tiempo real

Gobernanza, seguridad y ética de datos

  • Requisitos de privacidad y cumplimiento de datos
  • Control de acceso y cifrado en sistemas de big data
  • Consideraciones éticas en el análisis a gran escala

Integración de Big Data con Inteligencia Empresarial

  • Visualización de datos y creación de tableros para big data
  • Conexión de canales de big data a herramientas de BI
  • Impulso de resultados empresariales mediante análisis avanzado

Resumen y próximos pasos

Requerimientos

  • Conocimiento sólido de conceptos de análisis de datos y modelado estadístico
  • Experiencia con herramientas de procesamiento de datos y lenguajes de programación como Python, R o Scala
  • Familiaridad con marcos de computación distribuida como Hadoop o Spark

Público objetivo

  • Científicos de datos que buscan dominar el procesamiento de datos a gran escala y el análisis predictivo
  • Analistas senior que buscan diseñar e implementar flujos de trabajo analíticos avanzados
  • Profesionales de I+D que se enfocan en soluciones innovadoras basadas en datos
 42 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas