Contacta con nosotros

Temario del curso

Parte 1 – Conceptos de Aprendizaje Profundo y DNN

Introducción a la IA, el Aprendizaje Automático y el Aprendizaje Profundo

  • Historia, conceptos básicos y aplicaciones habituales de la inteligencia artificial, más allá de las fantasías asociadas a este dominio.
  • Inteligencia Colectiva: agregación de conocimiento compartido por muchos agentes virtuales.
  • Algoritmos genéticos: para evolucionar una población de agentes virtuales mediante selección.
  • Máquina de aprendizaje habitual: definición.
  • Tipos de tareas: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje por refuerzo.
  • Tipos de acciones: clasificación, regresión, agrupamiento (clustering), estimación de densidad, reducción de dimensionalidad.
  • Ejemplos de algoritmos de aprendizaje automático: regresión lineal, Naive Bayes, Árboles Aleatorios.
  • Aprendizaje automático VS Aprendizaje profundo: problemas en los que el aprendizaje automático sigue siendo hoy en día el estado del arte (Bosques Aleatorios y XGBoosts).

Conceptos básicos de una red neuronal (Aplicación: perc multilayer perceptron)

  • Repaso de las bases matemáticas.
  • Definición de una red de neurones: arquitectura clásica, activación y
  • Ponderación de activaciones anteriores, profundidad de una red.
  • Definición del aprendizaje de una red de neurones: funciones de costo, retropropagación, descenso del gradiente estocástico, máxima verosimilitud.
  • Modelado de una red neuronal: modelado de datos de entrada y salida según el tipo de problema (regresión, clasificación...). La maldición de la dimensionalidad.
  • Distinción entre datos multivariable y señal. Elección de una función de costo según los datos.
  • Aproximación de una función por una red de neurones: presentación y ejemplos.
  • Aproximación de una distribución por una red de neurones: presentación y ejemplos.
  • Aumento de datos: cómo equilibrar un conjunto de datos.
  • Generalización de los resultados de una red de neurones.
  • Inicialización y regularización de una red neuronal: regularización L1 / L2, Normalización por Lotes (Batch Normalization).
  • Algoritmos de optimización y convergencia.

Herramientas estándar de ML / DL

Se prevé una presentación sencilla con ventajas, desventajas, posición en el ecosistema y usos.

  • Herramientas de gestión de datos: Apache Spark, Apache Hadoop Tools.
  • Aprendizaje automático: Numpy, Scipy, Sci-kit.
  • Frameworks de alto nivel de DL: PyTorch, Keras, Lasagne.
  • Frameworks de bajo nivel de DL: Theano, Torch, Caffe, TensorFlow.

Redes Neuronales Convolucionales (CNN).

  • Presentación de las CNN: principios fundamentales y aplicaciones.
  • Funcionamiento básico de una CNN: capa convolucional, uso de un kernel,
  • Padding y stride, generación del mapa de características, capas de agrupamiento (pooling). Extensiones 1D, 2D y 3D.
  • Presentación de las diferentes arquitecturas de CNN que llevaron al estado del arte en clasificación.
  • Imágenes: LeNet, VGG Networks, Network in Network, Inception, Resnet. Presentación de las innovaciones aportadas por cada arquitectura y sus aplicaciones más globales (Convolution 1x1 o conexiones residuales).
  • Uso de un modelo de atención.
  • Aplicación a un caso de clasificación común (texto o imagen).
  • CNNs para generación: super-resolución, segmentación píxel a píxel. Presentación de
  • Principales estrategias para aumentar los mapas de características para la generación de imágenes.

Redes Neuronales Recurrentes (RNN).

  • Presentación de las RNN: principios fundamentales y aplicaciones.
  • Funcionamiento básico de la RNN: activación oculta, retropropagación a través del tiempo, versión desplegada.
  • Evoluciones hacia las Unidades Recurrentes Puenteadas (GRUs) y LSTM (Long Short Term Memory).
  • Presentación de los diferentes estados y las evoluciones aportadas por estas arquitecturas.
  • Problemas de convergencia y gradiente que se desvanece (vanishing gradient).
  • Arquitecturas clásicas: predicción de una serie temporal, clasificación...
  • Arquitectura de tipo codificador-decodificador RNN. Uso de un modelo de atención.
  • Aplicaciones PLN (Procesamiento de Lenguaje Natural): codificación de palabras / caracteres, traducción.
  • Aplicaciones en video: predicción de la siguiente imagen generada de una secuencia de video.

Modelos generativos: Autoencoder Variacional (VAE) y Redes Generativas Antagónicas (GAN).

  • Presentación de los modelos generativos, vínculo con las CNNs.
  • Autoencoder: reducción de dimensionalidad y generación limitada.
  • Autoencoder variacional: modelo generativo y aproximación de la distribución de un conjunto dado. Definición y uso del espacio latente. Truco de reparametrización. Aplicaciones y límites observados.
  • Redes Generativas Antagónicas: Fundamentos.
  • Arquitectura de red dual (Generador y discriminador) con aprendizaje alternativo, funciones de costo disponibles.
  • Convergencia de una GAN y dificultades encontradas.
  • Mejora de la convergencia: Wasserstein GAN, Began. Distancia de movimiento terrestre (Earth Moving Distance).
  • Aplicaciones para la generación de imágenes o fotografías, generación de texto, super-resolución.

Aprendizaje por Refuerzo Profundo.

  • Presentación del aprendizaje por refuerzo: control de un agente en un entorno definido.
  • Mediante un estado y acciones posibles.
  • Uso de una red neuronal para aproximar la función de estado.
  • Deep Q Learning: experiencia de repetición y aplicación al control de un videojuego.
  • Optimización de la política de aprendizaje. On-policy y off-policy. Arquitectura actor-crítico. A3C.
  • Aplicaciones: control de un videojuego único o un sistema digital.

Parte 2 – Theano para el Aprendizaje Profundo

Fundamentos de Theano

  • Introducción
  • Instalación y configuración

Funciones de Theano

  • entradas, salidas, actualizaciones, datos fijos (givens)

Entrenamiento y optimización de una red neuronal usando Theano

  • Modelado de la red neuronal
  • Regresión logística
  • Capas ocultas
  • Entrenamiento de una red
  • Cálculo y clasificación
  • Optimización
  • Log Loss

Prueba del modelo

Parte 3 – DNN usando TensorFlow

Fundamentos de TensorFlow

  • Creación, inicialización, guardado y restauración de variables de TensorFlow
  • Alimentación, lectura y precarga de datos de TensorFlow
  • Cómo utilizar la infraestructura de TensorFlow para entrenar modelos a escala
  • Visualización y evaluación de modelos con TensorBoard

Mecánica de TensorFlow

  • Preparar los datos
  • Descarga
  • Entradas y placeholders
  • Construir los grafos
    • Inferencia
    • Pérdida (Loss)
    • Entrenamiento
  • Entrenar el modelo
    • El grafo
    • La sesión
    • Bucle de entrenamiento
  • Evaluar el modelo
    • Construir el grafo de evaluación
    • Salida de la evaluación

El Perceptrón

  • Funciones de activación
  • El algoritmo de aprendizaje del perceptrón
  • Clasificación binaria con el perceptrón
  • Clasificación de documentos con el perceptrón
  • Limitaciones del perceptrón

Del Perceptrón a las Máquinas de Vectores de Soporte (SVM)

  • Kernels y el truco del kernel
  • Clasificación de margen máximo y vectores de soporte

Redes Neuronales Artificiales

  • Límites de decisión no lineales
  • Redes neuronales artificiales de alimentación hacia adelante y retroalimentación
  • Perceptrones multicapa
  • Minimización de la función de costo
  • Propagación hacia adelante
  • Retropropagación
  • Mejora de la forma en que las redes neuronales aprenden

Redes Neuronales Convolucionales

  • Objetivos
  • Arquitectura del modelo
  • Principios
  • Organización del código
  • Lanzamiento y entrenamiento del modelo
  • Evaluación de un modelo

Introducciones básicas que se deben impartir a los siguientes módulos (Introducción breve según la disponibilidad de tiempo):

Tensorflow – Uso avanzado

  • Hilo (Threading) y colas (Queues)
  • TensorFlow distribuido
  • Escritura de documentación y compartición de tu modelo
  • Personalización de lectores de datos
  • Manipulación de archivos de modelos de TensorFlow

TensorFlow Serving

  • Introducción
  • Tutorial de servicio básico
  • Tutorial de servicio avanzado
  • Tutorial de servicio del modelo Inception

Requerimientos

Antecedentes en física, matemáticas y programación. Participación en actividades de procesamiento de imágenes.

Los participantes deben tener un conocimiento previo de los conceptos de aprendizaje automático y haber trabajado con programación y bibliotecas de Python.

 35 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas