Contacta con nosotros

Temario del curso

Introducción a AIOps

  • ¿Qué es AIOps y por qué es importante?
  • Monitoreo tradicional frente a la observabilidad impulsada por AIOps.
  • Arquitectura de AIOps y componentes clave.

Recolección y normalización de datos operativos

  • Tipos de datos de observabilidad: métricas, registros y trazas.
  • Ingestión de datos desde múltiples fuentes (servidores, contenedores, nube).
  • Uso de agentes y exportadores (Prometheus, Beats, Fluentd).

Correlación de datos y detección de anomalías

  • Correlación de series temporales y métodos estadísticos.
  • Uso de modelos de aprendizaje automático para la detección de anomalías.
  • Detección de incidentes en sistemas distribuidos.

Alertas y reducción de ruido

  • Diseño de reglas de alerta inteligentes y umbrales.
  • Supresión, deduplicación y agrupación de alertas.
  • Integración con Alertmanager, Slack, PagerDuty u Opsgenie.

Análisis de causa raíz y visualización

  • Uso de paneles de control para visualizar métricas y detectar tendencias.
  • Exploración de eventos y líneas de tiempo para el análisis de causa raíz.
  • Rastreo de problemas en diferentes capas con herramientas de trazado distribuido.

Automatización y corrección

  • Activación de scripts o flujos de trabajo automatizados a partir de incidentes.
  • Integración con sistemas ITSM (ServiceNow, Jira).
  • Casos de uso: autosanación, escalado y reenvío de tráfico.

Plataformas de AIOps de código abierto y comerciales

  • Descripción general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace.
  • Criterios de evaluación para seleccionar una plataforma de AIOps.
  • Demostración y práctica con un conjunto de herramientas seleccionado.

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos de operaciones de TI y monitoreo de sistemas.
  • Experiencia con herramientas de monitoreo o paneles de control.
  • Conocimiento básico de formatos de registros y métricas.

Público objetivo

  • Equipos de operaciones responsables de la infraestructura y las aplicaciones.
  • Ingenieros de Fiabilidad del Sitio (SRE).
  • Equipos de monitoreo y observabilidad de TI.
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas