Contacta con nosotros

Temario del curso

Introducción al Aprendizaje por Refuerzo y la IA Agencial

  • Toma de decisiones bajo incertidumbre y planificación secuencial
  • Componentes clave de RL: agentes, entornos, estados y recompensas
  • Papel de RL en sistemas de IA adaptativa y agencial

Procesos de Decisión de Markov (MDP)

  • Definición formal y propiedades de los MDP
  • Funciones de valor, ecuaciones de Bellman y programación dinámica
  • Evaluación de políticas, mejora e iteración

Aprendizaje por Refuerzo sin Modelos

  • Aprendizaje Monte Carlo y Diferencia Temporal (TD)
  • Q-learning y SARSA
  • Práctica: implementación de métodos de RL tabular en Python

Aprendizaje por Refuerzo Profundo

  • Combinación de redes neuronales con RL para aproximación de funciones
  • Deep Q-Networks (DQN) y experiencia de replay
  • Arquitecturas Actor-Crítico y gradientes de políticas
  • Práctica: entrenamiento de un agente utilizando DQN y PPO con Stable-Baselines3

Estrategias de Exploración y Diseño de Recompensas

  • Equilibrio entre exploración y explotación (épsilon-greedy, UCB, métodos de entropía)
  • Diseño de funciones de recompensa y evitar comportamientos no deseados
  • Diseño de recompensas y aprendizaje por currículo

Temas Avanzados en RL y Toma de Decisiones

  • Aprendizaje por refuerzo multiagente y estrategias cooperativas
  • Aprendizaje por refuerzo jerárquico y marco de opciones
  • RL offline y aprendizaje por imitación para despliegues más seguros

Entornos de Simulación y Evaluación

  • Uso de OpenAI Gym y entornos personalizados
  • Espacios de acción continuos versus discretos
  • Métricas de rendimiento, estabilidad y eficiencia de muestreo del agente

Integración de RL en Sistemas de IA Agencial

  • Combinación de razonamiento y RL en arquitecturas de agentes híbridos
  • Integración del aprendizaje por refuerzo con agentes que utilizan herramientas
  • Consideraciones operativas para la escalabilidad y el despliegue

Proyecto Final

  • Diseñar e implementar un agente de aprendizaje por refuerzo para una tarea simulada
  • Analizar el rendimiento del entrenamiento y optimizar los hiperparámetros
  • Demostrar comportamiento adaptativo y toma de decisiones en un contexto agencial

Resumen y Próximos Pasos

Requerimientos

  • Sólida competencia en programación con Python
  • Comprensión sólida de conceptos de aprendizaje automático y aprendizaje profundo
  • Familiaridad con álgebra lineal, probabilidad y métodos básicos de optimización

Público Objetivo

  • Ingenieros de aprendizaje por refuerzo e investigadores de IA aplicada
  • Desarrolladores de robótica y automatización
  • Equipos de ingeniería que trabajan en sistemas de IA adaptativa y agencial
 28 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas