Contacta con nosotros

Temario del curso

Introducción al Aprendizaje por Refuerzo

  • Panorama general del aprendizaje por refuerzo y sus aplicaciones.
  • Diferencias entre aprendizaje supervisado, no supervisado y por refuerzo.
  • Conceptos clave: agente, entorno, recompensas y política.

Procesos de Decisión de Markov (MDP)

  • Comprensión de estados, acciones, recompensas y transiciones de estado.
  • Funciones de valor y la Ecuación de Bellman.
  • Programación dinámica para resolver MDP.

Algoritmos Centrales de RL

  • Métodos tabulares: Q-Learning y SARSA.
  • Métodos basados en políticas: algoritmo REINFORCE.
  • Frameworks Actor-Critic y sus aplicaciones.

Aprendizaje por Refuerzo Profundo

  • Introducción a las Redes Cerebrales Profundas (DQN).
  • Repaso de experiencias y redes objetivo.
  • Gradientes de política y métodos avanzados de RL profundo.

Frameworks y Herramientas de RL

  • Introducción a OpenAI Gym y otros entornos de RL.
  • Uso de PyTorch o TensorFlow para el desarrollo de modelos de RL.
  • Entrenamiento, pruebas y evaluación de agentes de RL.

Desafíos en RL

  • Equilibrio entre exploración y explotación durante el entrenamiento.
  • Manejo de recompensas escasas y problemas de asignación de crédito.
  • Escalabilidad y desafíos computacionales en RL.

Actividades Prácticas

  • Implementación de los algoritmos Q-Learning y SARSA desde cero.
  • Entrenamiento de un agente basado en DQN para jugar un juego simple en OpenAI Gym.
  • Ajuste fino de modelos de RL para mejorar el rendimiento en entornos personalizados.

Resumen y Siguientes Pasos

Requerimientos

  • Sólido comprensión de los principios y algoritmos de aprendizaje automático.
  • Dominio de la programación en Python.
  • Familiaridad con redes neuronales y frameworks de aprendizaje profundo.

Público Objetivo

  • Ingenieros de aprendizaje automático.
  • Especialistas en IA.
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas