Temario del curso

Fundamentos de Sistemas Agenciales en Producción

  • Arquitecturas agenciales: bucles, herramientas, memoria y capas de orquestación
  • Ciclo de vida de los agentes: desarrollo, despliegue y operación continua
  • Desafíos de la gestión de agentes a escala de producción

Infraestructura y Modelos de Despliegue

  • Desplegar agentes en entornos contenerizados y de la nube
  • Patrones de escalabilidad: escalado horizontal vs vertical, concurrencia y limitación
  • Orquestación multi-agente y equilibrio de carga

Monitoreo y Observabilidad

  • Métricas clave: latencia, tasa de éxito, uso de memoria y profundidad de llamadas del agente
  • Rastreo de la actividad del agente y gráficos de llamadas
  • Instrumentación de observabilidad utilizando Prometheus, OpenTelemetry y Grafana

Registro, Auditoría y Cumplimiento

  • Registro centralizado y recolección estructurada de eventos
  • Cumplimiento y auditoría en flujos de trabajo agenciales
  • Diseño de rastros de auditoría y mecanismos de reproducción para depuración

Optimización del Rendimiento y los Recursos

  • Reducción de la sobrecarga de inferencia y optimización de ciclos de orquestación de agentes
  • Caché de modelos y embebidos ligeros para una recuperación más rápida
  • Pruebas de carga y escenarios de estrés para pipelines AI

Control de Costos y Gobernanza

  • Comprensión de los factores que influyen en el costo de los agentes: llamadas API, memoria, computación e integraciones externas
  • Seguimiento de costos a nivel de agente y implementación de modelos de cobro
  • Políticas de automatización para prevenir la proliferación de agentes y el consumo de recursos inactivos

Estrategias CI/CD y Despliegue de Agentes

  • Integración de pipelines de agentes en sistemas CI/CD
  • Pruebas, versionado y estrategias de reversión para actualizaciones iterativas de agentes
  • Despliegues progresivos y mecanismos de despliegue seguro

Recuperación de Fallos e Ingeniería de Fiabilidad

  • Diseño para tolerancia a fallos y degradación gradual
  • Patrones de reintento, tiempo de espera y circuito breaker para la fiabilidad del agente
  • Marco de respuesta a incidentes y post-mortem para operaciones AI

Proyecto Final

  • Construir y desplegar un sistema AI agencial con monitoreo completo y seguimiento de costos
  • Simular carga, medir rendimiento y optimizar el uso de recursos
  • Presentar la arquitectura final y el panel de monitoreo a compañeros

Resumen y Pasos Siguientes

Requerimientos

  • Conocimiento sólido de MLOps y sistemas de machine learning en producción
  • Experiencia con despliegues contenerizados (Docker/Kubernetes)
  • Familiaridad con herramientas de optimización de costos y observabilidad en la nube

Audiencia

  • Ingenieros MLOps
  • Ingenieros de Fiabilidad del Sitio (SREs)
  • Gerentes de ingeniería que supervisan infraestructura AI
 21 Horas

Número de participantes


Precio por Participante​

Testimonios (3)

Próximos cursos

Categorías Relacionadas