Temario del curso
Parte 1 – Conceptos de Aprendizaje Profundo y DNN
Introducción a la IA, el Aprendizaje Automático y el Aprendizaje Profundo
- Historia, conceptos básicos y aplicaciones habituales de la inteligencia artificial, más allá de las fantasías asociadas a este dominio.
- Inteligencia Colectiva: agregación de conocimiento compartido por muchos agentes virtuales.
- Algoritmos genéticos: para evolucionar una población de agentes virtuales mediante selección.
- Máquina de aprendizaje habitual: definición.
- Tipos de tareas: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje por refuerzo.
- Tipos de acciones: clasificación, regresión, agrupamiento (clustering), estimación de densidad, reducción de dimensionalidad.
- Ejemplos de algoritmos de aprendizaje automático: regresión lineal, Naive Bayes, Árboles Aleatorios.
- Aprendizaje automático VS Aprendizaje profundo: problemas en los que el aprendizaje automático sigue siendo hoy en día el estado del arte (Bosques Aleatorios y XGBoosts).
Conceptos básicos de una red neuronal (Aplicación: perc multilayer perceptron)
- Repaso de las bases matemáticas.
- Definición de una red de neurones: arquitectura clásica, activación y
- Ponderación de activaciones anteriores, profundidad de una red.
- Definición del aprendizaje de una red de neurones: funciones de costo, retropropagación, descenso del gradiente estocástico, máxima verosimilitud.
- Modelado de una red neuronal: modelado de datos de entrada y salida según el tipo de problema (regresión, clasificación...). La maldición de la dimensionalidad.
- Distinción entre datos multivariable y señal. Elección de una función de costo según los datos.
- Aproximación de una función por una red de neurones: presentación y ejemplos.
- Aproximación de una distribución por una red de neurones: presentación y ejemplos.
- Aumento de datos: cómo equilibrar un conjunto de datos.
- Generalización de los resultados de una red de neurones.
- Inicialización y regularización de una red neuronal: regularización L1 / L2, Normalización por Lotes (Batch Normalization).
- Algoritmos de optimización y convergencia.
Herramientas estándar de ML / DL
Se prevé una presentación sencilla con ventajas, desventajas, posición en el ecosistema y usos.
- Herramientas de gestión de datos: Apache Spark, Apache Hadoop Tools.
- Aprendizaje automático: Numpy, Scipy, Sci-kit.
- Frameworks de alto nivel de DL: PyTorch, Keras, Lasagne.
- Frameworks de bajo nivel de DL: Theano, Torch, Caffe, TensorFlow.
Redes Neuronales Convolucionales (CNN).
- Presentación de las CNN: principios fundamentales y aplicaciones.
- Funcionamiento básico de una CNN: capa convolucional, uso de un kernel,
- Padding y stride, generación del mapa de características, capas de agrupamiento (pooling). Extensiones 1D, 2D y 3D.
- Presentación de las diferentes arquitecturas de CNN que llevaron al estado del arte en clasificación.
- Imágenes: LeNet, VGG Networks, Network in Network, Inception, Resnet. Presentación de las innovaciones aportadas por cada arquitectura y sus aplicaciones más globales (Convolution 1x1 o conexiones residuales).
- Uso de un modelo de atención.
- Aplicación a un caso de clasificación común (texto o imagen).
- CNNs para generación: super-resolución, segmentación píxel a píxel. Presentación de
- Principales estrategias para aumentar los mapas de características para la generación de imágenes.
Redes Neuronales Recurrentes (RNN).
- Presentación de las RNN: principios fundamentales y aplicaciones.
- Funcionamiento básico de la RNN: activación oculta, retropropagación a través del tiempo, versión desplegada.
- Evoluciones hacia las Unidades Recurrentes Puenteadas (GRUs) y LSTM (Long Short Term Memory).
- Presentación de los diferentes estados y las evoluciones aportadas por estas arquitecturas.
- Problemas de convergencia y gradiente que se desvanece (vanishing gradient).
- Arquitecturas clásicas: predicción de una serie temporal, clasificación...
- Arquitectura de tipo codificador-decodificador RNN. Uso de un modelo de atención.
- Aplicaciones PLN (Procesamiento de Lenguaje Natural): codificación de palabras / caracteres, traducción.
- Aplicaciones en video: predicción de la siguiente imagen generada de una secuencia de video.
Modelos generativos: Autoencoder Variacional (VAE) y Redes Generativas Antagónicas (GAN).
- Presentación de los modelos generativos, vínculo con las CNNs.
- Autoencoder: reducción de dimensionalidad y generación limitada.
- Autoencoder variacional: modelo generativo y aproximación de la distribución de un conjunto dado. Definición y uso del espacio latente. Truco de reparametrización. Aplicaciones y límites observados.
- Redes Generativas Antagónicas: Fundamentos.
- Arquitectura de red dual (Generador y discriminador) con aprendizaje alternativo, funciones de costo disponibles.
- Convergencia de una GAN y dificultades encontradas.
- Mejora de la convergencia: Wasserstein GAN, Began. Distancia de movimiento terrestre (Earth Moving Distance).
- Aplicaciones para la generación de imágenes o fotografías, generación de texto, super-resolución.
Aprendizaje por Refuerzo Profundo.
- Presentación del aprendizaje por refuerzo: control de un agente en un entorno definido.
- Mediante un estado y acciones posibles.
- Uso de una red neuronal para aproximar la función de estado.
- Deep Q Learning: experiencia de repetición y aplicación al control de un videojuego.
- Optimización de la política de aprendizaje. On-policy y off-policy. Arquitectura actor-crítico. A3C.
- Aplicaciones: control de un videojuego único o un sistema digital.
Parte 2 – Theano para el Aprendizaje Profundo
Fundamentos de Theano
- Introducción
- Instalación y configuración
Funciones de Theano
- entradas, salidas, actualizaciones, datos fijos (givens)
Entrenamiento y optimización de una red neuronal usando Theano
- Modelado de la red neuronal
- Regresión logística
- Capas ocultas
- Entrenamiento de una red
- Cálculo y clasificación
- Optimización
- Log Loss
Prueba del modelo
Parte 3 – DNN usando TensorFlow
Fundamentos de TensorFlow
- Creación, inicialización, guardado y restauración de variables de TensorFlow
- Alimentación, lectura y precarga de datos de TensorFlow
- Cómo utilizar la infraestructura de TensorFlow para entrenar modelos a escala
- Visualización y evaluación de modelos con TensorBoard
Mecánica de TensorFlow
- Preparar los datos
- Descarga
- Entradas y placeholders
-
Construir los grafos
- Inferencia
- Pérdida (Loss)
- Entrenamiento
-
Entrenar el modelo
- El grafo
- La sesión
- Bucle de entrenamiento
-
Evaluar el modelo
- Construir el grafo de evaluación
- Salida de la evaluación
El Perceptrón
- Funciones de activación
- El algoritmo de aprendizaje del perceptrón
- Clasificación binaria con el perceptrón
- Clasificación de documentos con el perceptrón
- Limitaciones del perceptrón
Del Perceptrón a las Máquinas de Vectores de Soporte (SVM)
- Kernels y el truco del kernel
- Clasificación de margen máximo y vectores de soporte
Redes Neuronales Artificiales
- Límites de decisión no lineales
- Redes neuronales artificiales de alimentación hacia adelante y retroalimentación
- Perceptrones multicapa
- Minimización de la función de costo
- Propagación hacia adelante
- Retropropagación
- Mejora de la forma en que las redes neuronales aprenden
Redes Neuronales Convolucionales
- Objetivos
- Arquitectura del modelo
- Principios
- Organización del código
- Lanzamiento y entrenamiento del modelo
- Evaluación de un modelo
Introducciones básicas que se deben impartir a los siguientes módulos (Introducción breve según la disponibilidad de tiempo):
Tensorflow – Uso avanzado
- Hilo (Threading) y colas (Queues)
- TensorFlow distribuido
- Escritura de documentación y compartición de tu modelo
- Personalización de lectores de datos
- Manipulación de archivos de modelos de TensorFlow
TensorFlow Serving
- Introducción
- Tutorial de servicio básico
- Tutorial de servicio avanzado
- Tutorial de servicio del modelo Inception
Requerimientos
Antecedentes en física, matemáticas y programación. Participación en actividades de procesamiento de imágenes.
Los participantes deben tener un conocimiento previo de los conceptos de aprendizaje automático y haber trabajado con programación y bibliotecas de Python.
Testimonios (2)
La capacitación estuvo bien organizada y planificada, y salí de ella con conocimientos sistemáticos y una buena visión de los temas que abordamos
Magdalena - Samsung Electronics Polska Sp. z o.o.
Curso - Deep Learning with TensorFlow 2
Traducción Automática
Me gustó mucho el final donde tuvimos la oportunidad de experimentar con CHAT GPT. La sala no estaba muy bien preparada para esto; en lugar de una gran mesa, varias mesas pequeñas nos habrían permitido formar grupos pequeños y generar ideas de manera más efectiva.
Nola - Laramie County Community College
Curso - Artificial Intelligence (AI) Overview
Traducción Automática