Contacta con nosotros

Temario del curso

Introducción al Aprendizaje por Refuerzo

  • ¿Qué es el aprendizaje por refuerzo?
  • Conceptos clave: agente, entorno, estados, acciones y recompensas
  • Desafíos en el aprendizaje por refuerzo

Exploración y Explotación

  • Equilibrar la exploración y la explotación en modelos de RL
  • Estrategias de exploración: epsilon-greedy, softmax y más

Q-Learning y Redes Q Profundas (DQNs)

  • Introducción al Q-learning
  • Implementación de DQNs utilizando TensorFlow
  • Optimización del Q-learning con experiencia de replay y redes objetivo

Métodos Basados en Políticas

  • Algoritmos de gradiente de política
  • Algoritmo REINFORCE y su implementación
  • Métodos actor-crítico

Trabajando con OpenAI Gym

  • Configuración de entornos en OpenAI Gym
  • Simulación de agentes en entornos dinámicos
  • Evaluación del rendimiento del agente

Técnicas Avanzadas de Aprendizaje por Refuerzo

  • Aprendizaje por refuerzo multiagente
  • Gradiente de política determinista profunda (DDPG)
  • Optimización de política proximal (PPO)

Despliegue de Modelos de Aprendizaje por Refuerzo

  • Aplicaciones del mundo real del aprendizaje por refuerzo
  • Integración de modelos RL en entornos de producción

Resumen y Próximos Pasos

Requerimientos

  • Experiencia con programación en Python
  • Comprensión básica de conceptos de aprendizaje profundo y aprendizaje automático
  • Conocimiento de algoritmos y conceptos matemáticos utilizados en el aprendizaje por refuerzo

Público objetivo

  • Científicos de datos
  • Practicantes de aprendizaje automático
  • Investigadores en IA
 28 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas