Temario del curso
Introducción al Aprendizaje Automático
- Tipos de aprendizaje automático – supervisado vs no supervisado
- Del aprendizaje estadístico al aprendizaje automático
- Flujo de trabajo de minería de datos: comprensión empresarial, preparación de datos, modelado, implementación
- Selección del algoritmo adecuado para la tarea
- Sobreajuste y el compromiso sesgo-varianza
Resumen de Python y Bibliotecas de ML
- ¿Por qué usar lenguajes de programación para ML?
- Elegir entre R y Python
- Curso intensivo de Python y Cuadernos de Jupyter
- Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Pruebas y Evaluación de Algoritmos de ML
- Generalización, sobreajuste y validación de modelos
- Estrategias de evaluación: retención, validación cruzada, bootstrapping
- Métricas para regresión: ME, MSE, RMSE, MAPE
- Métricas para clasificación: precisión, matriz de confusión, clases desbalanceadas
- Visualización del rendimiento del modelo: curva de ganancias, curva ROC, curva de elevación
- Selección de modelos y búsqueda en cuadrícula para ajuste
Preparación de Datos
- Importación y almacenamiento de datos en Python
- Análisis exploratorio y estadísticas descriptivas
- Gestión de valores faltantes y valores atípicos
- Estandarización, normalización y transformación
- Recodificación de datos cualitativos y manipulación de datos con pandas
Algoritmos de Clasificación
- Clasificación binaria vs multiclase
- Regresión logística y funciones de discriminación
- Bayes ingenuo, k-vectores más cercanos
- Árboles de decisión: CART, Bosques Aleatorios, Bagging, Boosting, XGBoost
- Máquinas de Vectores de Soporte y núcleos
- Técnicas de aprendizaje en conjunto
Regresión y Predicción Numérica
- Mínimos cuadrados y selección de variables
- Métodos de regularización: L1, L2
- Regresión polinomial y modelos no lineales
- Árboles de regresión y splines
Aprendizaje No Supervisado
- Técnicas de agrupamiento: k-medias, k-medoides, agrupamiento jerárquico, SOMs
- Reducción de dimensionalidad: PCA, análisis de factores, SVD
- Escalamiento multidimensional
Minería de Texto
- Preprocesamiento de texto y tokenización
- Bolsa de palabras, stemming y lematización
- Análisis de sentimiento y frecuencia de palabras
- Visualización de datos de texto con nubes de palabras
Sistemas de Recomendación
- Filtrado colaborativo basado en usuarios y basado en elementos
- Diseño y evaluación de motores de recomendación
Minería de Patrones de Asociación
- Conjuntos de ítems frecuentes y algoritmo Apriori
- Análisis de cestas de mercado y ratio de elevación
Detección de Valores Atípicos
- Análisis de valores extremos
- Métodos basados en distancia y densidad
- Detección de valores atípicos en datos de alta dimensión
Caso de Estudio de Aprendizaje Automático
- Comprensión del problema empresarial
- Preprocesamiento de datos e ingeniería de características
- Selección de modelos y ajuste de parámetros
- Evaluación y presentación de hallazgos
- Implementación
Resumen y Próximos Pasos
Requerimientos
- Conocimiento básico de estadística y álgebra lineal
- Familiaridad con conceptos de análisis de datos o inteligencia empresarial
- Se recomienda tener alguna exposición a la programación (preferiblemente Python o R)
- Interés en aprender aprendizaje automático aplicado para proyectos basados en datos
Público Objetivo
- Analistas y científicos de datos
- Estadísticos y profesionales de la investigación
- Desarrolladores y profesionales de TI que exploran herramientas de aprendizaje automático
- Cualquier persona involucrada en proyectos de ciencia de datos o análisis predictivo
Testimonios (3)
A pesar de tener que faltar un día debido a reuniones con clientes, siento que tengo una comprensión mucho más clara de los procesos y técnicas utilizados en el Aprendizaje Automático y cuándo usaría un enfoque en lugar de otro. Nuestro desafío ahora es practicar lo que hemos aprendido y comenzar a aplicarlo a nuestro dominio de problemas.
Richard Blewett - Rock Solid Knowledge Ltd
Curso - Machine Learning – Data science
Traducción Automática
Me gustó que la formación se centrara en ejemplos y codificación. Pensé que era imposible incluir tanto contenido en tres días de formación, pero me equivoqué. La formación cubrió muchos temas y todo se realizó de manera muy detallada (especialmente el ajuste de los parámetros del modelo, no esperaba que hubiera tiempo para esto y quedé muy sorprendido).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
Traducción Automática
Muestra muchos métodos con scripts prepreparados, materiales muy bien preparados y fáciles de rastrear.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
Traducción Automática