Contacta con nosotros

Temario del curso

Fundamentos de los Sistemas Agénticos en Producción

  • Arquitecturas agénticas: bucles, herramientas, memoria y capas de orquestación.
  • Ciclo de vida de los agentes: desarrollo, implementación y operación continua.
  • Desafíos de la gestión de agentes a escala de producción.

Infraestructura y Modelos de Implementación

  • Despliegue de agentes en entornos contenerizados y en la nube.
  • Patrones de escalado: escalado horizontal frente a vertical, concurrencia y limitación de tasa (throttling).
  • Orquestación multi-agente y balanceo de cargas.

Monitoreo y Observabilidad

  • Métricas clave: latencia, tasa de éxito, uso de memoria y profundidad de llamadas del agente.
  • Rastreo de la actividad del agente y gráficos de llamadas.
  • Instrumentación de la observabilidad utilizando Prometheus, OpenTelemetry y Grafana.

Registro de Eventos (Logging), Auditoría y Cumplimiento

  • Registro centralizado y recolección de eventos estructurados.
  • Cumplimiento y trazabilidad en flujos de trabajo agénticos.
  • Diseño de registros de auditoría y mecanismos de reproducción para depuración.

Ajuste de Rendimiento y Optimización de Recursos

  • Reducción de la sobrecarga de inferencia y optimización de los ciclos de orquestación de agentes.
  • Caché de modelos y embebimientos ligeros para una recuperación más rápida.
  • Pruebas de carga y escenarios de estrés para pipelines de IA.

Control de Costos y Gobernanza

  • Comprensión de los impulsores de costos de los agentes: llamadas a la API, memoria, capacidad de cómputo e integraciones externas.
  • Seguimiento de los costos a nivel de agente e implementación de modelos de reembolso (chargeback).
  • Políticas de automatización para prevenir la dispersión de agentes y el consumo de recursos inactivos.

Estrategias de CI/CD y Despliegue para Agentes

  • Integración de pipelines de agentes en sistemas de CI/CD.
  • Pruebas, versionado y estrategias de reversión para actualizaciones iterativas de agentes.
  • Despliegues progresivos y mecanismos de despliegue seguro.

Recuperación ante Fallos e Ingeniería de Confiabilidad

  • Diseño para la tolerancia a fallos y la degradación graciosa.
  • Patrones de reintento, tiempos de espera y breakers de circuito para la confiabilidad de los agentes.
  • Respuesta a incidentes y marcos de análisis posterior (post-mortem) para operaciones de IA.

Proyecto Final (Capstone)

  • Construir e implementar un sistema de IA agéntica con monitoreo y seguimiento de costos completos.
  • Simular carga, medir el rendimiento y optimizar el uso de recursos.
  • Presentar la arquitectura final y el panel de monitoreo a los compañeros.

Resumen y Próximos Pasos

Requerimientos

  • Sólido entendimiento de MLOps y sistemas de aprendizaje automático en producción.
  • Experiencia con implementaciones contenerizadas (Docker/Kubernetes).
  • Familiaridad con herramientas de optimización de costos en la nube y observabilidad.

Audiencia

  • Ingenieros de MLOps.
  • Ingenieros de Confiabilidad del Sitio (SRE).
  • Gerentes de ingeniería que supervisan la infraestructura de IA.
 21 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas