Contacta con nosotros

Temario del curso

Diseño de una arquitectura AIOps abierta

  • Resumen de los componentes clave en las canalizaciones AIOps de código abierto.
  • Flujo de datos desde la ingestión hasta la gestión de alertas.
  • Comparación de herramientas y estrategia de integración.

Recopilación y agregación de datos

  • Ingestión de datos de series temporales con Prometheus.
  • Captura de registros con Logstash y Beats.
  • Normalización de datos para correlación entre fuentes.

Construcción de tableros de observabilidad

  • Visualización de métricas con Grafana.
  • Construcción de tableros de Kibana para análisis de registros.
  • Uso de consultas de Elasticsearch para extraer información operativa.

Detección de anomalías y predicción de incidentes

  • Exportación de datos de observabilidad a canalizaciones de Python.
  • Entrenamiento de modelos de aprendizaje automático para detección de valores atípicos y pronóstico.
  • Implementación de modelos para inferencia en tiempo real dentro de la canalización de observabilidad.

Alertas y automatización con herramientas de código abierto

  • Creación de reglas de alerta en Prometheus y enrutamiento de Alertmanager.
  • Activación de scripts o flujos de trabajo de API para respuestas automáticas.
  • Uso de herramientas de orquestación de código abierto (por ejemplo, Ansible, Rundeck).

Consideraciones de integración y escalabilidad

  • Manejo de ingestión de alto volumen y retención a largo plazo.
  • Seguridad y control de acceso en pilas de código abierto.
  • Escalado independiente de cada capa: ingestión, procesamiento y alertas.

Aplicaciones del mundo real y extensiones

  • Estudios de caso: optimización del rendimiento, prevención de tiempos de inactividad y optimización de costos.
  • Extensión de las canalizaciones con herramientas de trazado o grafos de servicios.
  • Mejores prácticas para ejecutar y mantener AIOps en producción.

Resumen y próximos pasos

Requerimientos

  • Experiencia con herramientas de observabilidad como Prometheus o ELK.
  • Conocimientos prácticos de Python y fundamentos del aprendizaje automático.
  • Comprensión de las operaciones de TI y los flujos de trabajo de gestión de alertas.

Público objetivo

  • Ingenieros avanzados de confiabilidad del sitio (SREs).
  • Ingenieros de datos que trabajan en operaciones.
  • Líderes de plataformas DevOps y arquitectos de infraestructura.
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas