Contacta con nosotros

Temario del curso

Introducción al Aprendizaje Automático

  • Tipos de aprendizaje automático – supervisado versus no supervisado
  • Del aprendizaje estadístico al aprendizaje automático
  • El flujo de trabajo de minería de datos: comprensión del negocio, preparación de datos, modelización, implementación
  • Selección del algoritmo adecuado para la tarea
  • Sobreajuste y el equilibrio sesgo-varianza

Descripción general de Python y librerías de ML

  • Por qué utilizar lenguajes de programación para ML
  • Elegir entre R y Python
  • Curso intensivo de Python y cuadernos de Jupyter
  • Librerías de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Prueba y evaluación de algoritmos de ML

  • Generalización, sobreajuste y validación de modelos
  • Estrategias de evaluación: holdout, validación cruzada, bootstrapping
  • Métricas para regresión: ME, MSE, RMSE, MAPE
  • Métricas para clasificación: precisión, matriz de confusión, clases desbalanceadas
  • Visualización del rendimiento del modelo: curva de beneficio, curva ROC, curva de elevación
  • Selección de modelos y búsqueda en cuadrícula para el ajuste de parámetros

Preparación de datos

  • Importación y almacenamiento de datos en Python
  • Análisis exploratorio y estadísticas descriptivas
  • Manejo de valores faltantes y valores atípicos
  • Estandarización, normalización y transformación
  • Recodificación de datos cualitativos y manipulación de datos con pandas

Algoritmos de clasificación

  • Clasificación binaria versus multiclase
  • Regresión logística y funciones discriminantes
  • Bayes ingenuo, k-vécinos más próximos
  • Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost
  • Máquinas de vectores de soporte y kernels
  • Técnicas de aprendizaje de conjuntos (ensemble)

Regresión y predicción numérica

  • Mínimos cuadrados y selección de variables
  • Métodos de regularización: L1, L2
  • Regresión polinómica y modelos no lineales
  • Árboles de regresión y splines

Redes neuronales

  • Introducción a las redes neuronales y el aprendizaje profundo
  • Funciones de activación, capas y retropropagación
  • Perceptrones multicapa (MLP)
  • Utilizar TensorFlow o PyTorch para la modelización básica de redes neuronales
  • Redes neuronales para clasificación y regresión

Predicción de ventas y análisis predictivo

  • Pronóstico basado en series temporales versus regresión
  • Manejo de datos con estacionalidad y tendencia
  • Construcción de un modelo de predicción de ventas utilizando técnicas de ML
  • Evaluación de la precisión e incertidumbre de las predicciones
  • Interpretación empresarial y comunicación de resultados

Aprendizaje no supervisado

  • Técnicas de agrupamiento: k-means, k-medoids, agrupamiento jerárquico, SOMs
  • Reducción de dimensionalidad: PCA, análisis factorial, SVD
  • Escalamiento multidimensional

Minería de texto

  • Preprocesamiento de texto y tokenización
  • Bag-of-words, reducción a la raíz y lematización
  • Análisis de sentimiento y frecuencia de palabras
  • Visualización de datos de texto con nubes de palabras

Sistemas de recomendación

  • Filtrado colaborativo basado en usuarios y basado en ítems
  • Diseño y evaluación de motores de recomendación

Minería de patrones de asociación

  • Conjuntos de ítems frecuentes y algoritmo Apriori
  • Análisis de canasta de mercado y ratio de elevación

Detección de valores atípicos

  • Análisis de valores extremos
  • Métodos basados en distancia y densidad
  • Detección de valores atípicos en datos de alta dimensión

Estudio de caso de Aprendizaje Automático

  • Comprensión del problema empresarial
  • Preprocesamiento de datos e ingeniería de características
  • Selección de modelos y ajuste de parámetros
  • Evaluación y presentación de los hallazgos
  • Implementación

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de conceptos de aprendizaje automático, como aprendizaje supervisado y no supervisado
  • Familiaridad con la programación en Python (variables, bucles, funciones)
  • Es útil, pero no obligatorio, tener experiencia manejando datos con librerías como pandas o NumPy
  • No se requiere experiencia previa en modelización avanzada o redes neuronales

Público objetivo

  • Científicos de datos
  • Analistas de negocios
  • Ingenieros de software y profesionales técnicos que trabajan con datos
 28 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas