Temario del curso
Fundamentos de Python para tareas de datos
- Instalación de Python y configuración del entorno de desarrollo
- Fundamentos del lenguaje: variables, tipos de datos y estructuras de control
- Escritura y ejecución de scripts simples de Python
Manejo de archivos: CSV y Excel
- Lectura y escritura de archivos CSV utilizando el módulo csv y Pandas
- Trabajo con archivos Excel utilizando openpyxl/xlrd y Pandas
- Ejercicios prácticos: automatización de conversiones de archivos
Introducción a Pandas
- Fundamentos de DataFrame: creación, indexación, selección y filtrado
- Operaciones de agregación y agrupamiento
- Operaciones comunes de limpieza: valores faltantes, duplicados y conversiones de tipo
Introducción a Polars
- Conceptos de Polars y características de rendimiento en comparación con Pandas
- Operaciones básicas de DataFrame en Polars
- Ejemplo de caso de uso: cuándo elegir Polars sobre Pandas
Transformación avanzada de datos (intermedio)
- Uniones complejas, funciones de ventana y operaciones de pivote en Pandas
- Patrones eficientes de procesamiento de datos con Polars
- Cadenas de operaciones y optimización del uso de memoria
Automatización de procesos con Python
- Escritura de scripts para automatizar tareas repetitivas de datos y pasos ETL
- Programación de scripts con programadores del sistema operativo
- Registro de eventos, manejo de errores y notificaciones
Empaquetado de scripts y mejores prácticas
- Creación de ejecutables con PyInstaller o herramientas similares
- Estructuración de proyectos, entornos virtuales y gestión de dependencias
- Fundamentos del control de versiones y documentación de flujos de trabajo
Mini proyecto práctico
- Tarea de extremo a extremo: leer archivos sin procesar, limpiar y transformar datos, producir salidas
- Automatizar el flujo de trabajo y empaquetarlo como un script ejecutable o un ejecutable
- Revisión y mejoras basadas en comentarios de compañeros
Resumen y próximos pasos
Requerimientos
- Familiaridad básica con conceptos de programación o disposición para aprender
- Comodidad utilizando la línea de comandos o la terminal para la instalación de paquetes
- Experiencia trabajando con hojas de cálculo (CSV/Excel)
Público objetivo
- Analistas de datos y personal operativo que automatizan tareas de datos
- Ingenieros analíticos que buscan scripting ETL ligero
- Profesionales interesados en flujos de trabajo de datos prácticos basados en Python
Testimonios (2)
Los ejercicios prácticos relacionados con el contenido realmente ayudan a comprender más sobre cada tema. Además, el estilo de comenzar la clase con una conferencia y continuar con ejercicios prácticos es bueno y útil para relacionarlo con la conferencia presentada anteriormente.
Nazeera Mohamad - Ministry of Science, Technology and Innovation
Curso - Introduction to Data Science and AI using Python
Traducción Automática
Ejemplos/ejercicios perfectamente adaptados a nuestro dominio
Luc - CS Group
Curso - Scaling Data Analysis with Python and Dask
Traducción Automática