Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Diseño de una arquitectura AIOps abierta
- Resumen de los componentes clave en las canalizaciones AIOps de código abierto.
- Flujo de datos desde la ingestión hasta la gestión de alertas.
- Comparación de herramientas y estrategia de integración.
Recopilación y agregación de datos
- Ingestión de datos de series temporales con Prometheus.
- Captura de registros con Logstash y Beats.
- Normalización de datos para correlación entre fuentes.
Construcción de tableros de observabilidad
- Visualización de métricas con Grafana.
- Construcción de tableros de Kibana para análisis de registros.
- Uso de consultas de Elasticsearch para extraer información operativa.
Detección de anomalías y predicción de incidentes
- Exportación de datos de observabilidad a canalizaciones de Python.
- Entrenamiento de modelos de aprendizaje automático para detección de valores atípicos y pronóstico.
- Implementación de modelos para inferencia en tiempo real dentro de la canalización de observabilidad.
Alertas y automatización con herramientas de código abierto
- Creación de reglas de alerta en Prometheus y enrutamiento de Alertmanager.
- Activación de scripts o flujos de trabajo de API para respuestas automáticas.
- Uso de herramientas de orquestación de código abierto (por ejemplo, Ansible, Rundeck).
Consideraciones de integración y escalabilidad
- Manejo de ingestión de alto volumen y retención a largo plazo.
- Seguridad y control de acceso en pilas de código abierto.
- Escalado independiente de cada capa: ingestión, procesamiento y alertas.
Aplicaciones del mundo real y extensiones
- Estudios de caso: optimización del rendimiento, prevención de tiempos de inactividad y optimización de costos.
- Extensión de las canalizaciones con herramientas de trazado o grafos de servicios.
- Mejores prácticas para ejecutar y mantener AIOps en producción.
Resumen y próximos pasos
Requerimientos
- Experiencia con herramientas de observabilidad como Prometheus o ELK.
- Conocimientos prácticos de Python y fundamentos del aprendizaje automático.
- Comprensión de las operaciones de TI y los flujos de trabajo de gestión de alertas.
Público objetivo
- Ingenieros avanzados de confiabilidad del sitio (SREs).
- Ingenieros de datos que trabajan en operaciones.
- Líderes de plataformas DevOps y arquitectos de infraestructura.
14 Horas