Temario del curso
Introducción al Aprendizaje por Refuerzo y la IA Agencial
- Toma de decisiones bajo incertidumbre y planificación secuencial
- Componentes clave de RL: agentes, entornos, estados y recompensas
- Papel de RL en sistemas de IA adaptativa y agencial
Procesos de Decisión de Markov (MDP)
- Definición formal y propiedades de los MDP
- Funciones de valor, ecuaciones de Bellman y programación dinámica
- Evaluación de políticas, mejora e iteración
Aprendizaje por Refuerzo sin Modelos
- Aprendizaje Monte Carlo y Diferencia Temporal (TD)
- Q-learning y SARSA
- Práctica: implementación de métodos de RL tabular en Python
Aprendizaje por Refuerzo Profundo
- Combinación de redes neuronales con RL para aproximación de funciones
- Deep Q-Networks (DQN) y experiencia de replay
- Arquitecturas Actor-Crítico y gradientes de políticas
- Práctica: entrenamiento de un agente utilizando DQN y PPO con Stable-Baselines3
Estrategias de Exploración y Diseño de Recompensas
- Equilibrio entre exploración y explotación (épsilon-greedy, UCB, métodos de entropía)
- Diseño de funciones de recompensa y evitar comportamientos no deseados
- Diseño de recompensas y aprendizaje por currículo
Temas Avanzados en RL y Toma de Decisiones
- Aprendizaje por refuerzo multiagente y estrategias cooperativas
- Aprendizaje por refuerzo jerárquico y marco de opciones
- RL offline y aprendizaje por imitación para despliegues más seguros
Entornos de Simulación y Evaluación
- Uso de OpenAI Gym y entornos personalizados
- Espacios de acción continuos versus discretos
- Métricas de rendimiento, estabilidad y eficiencia de muestreo del agente
Integración de RL en Sistemas de IA Agencial
- Combinación de razonamiento y RL en arquitecturas de agentes híbridos
- Integración del aprendizaje por refuerzo con agentes que utilizan herramientas
- Consideraciones operativas para la escalabilidad y el despliegue
Proyecto Final
- Diseñar e implementar un agente de aprendizaje por refuerzo para una tarea simulada
- Analizar el rendimiento del entrenamiento y optimizar los hiperparámetros
- Demostrar comportamiento adaptativo y toma de decisiones en un contexto agencial
Resumen y Próximos Pasos
Requerimientos
- Sólida competencia en programación con Python
- Comprensión sólida de conceptos de aprendizaje automático y aprendizaje profundo
- Familiaridad con álgebra lineal, probabilidad y métodos básicos de optimización
Público Objetivo
- Ingenieros de aprendizaje por refuerzo e investigadores de IA aplicada
- Desarrolladores de robótica y automatización
- Equipos de ingeniería que trabajan en sistemas de IA adaptativa y agencial
Testimonios (3)
El instructor es paciente y muy útil. Conoce bien el tema.
CLIFFORD TABARES - Universal Leaf Philippines, Inc.
Curso - Agentic AI for Business Automation: Use Cases & Integration
Traducción Automática
Buena mezcla de conocimiento y práctica
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Agentic AI for Enterprise Applications
Traducción Automática
La mezcla de teoría y práctica, así como de perspectivas de alto y bajo nivel
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Autonomous Decision-Making with Agentic AI
Traducción Automática