Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Visión general de las capacidades de optimización de CANN
- Cómo se maneja el rendimiento de la inferencia en CANN.
- Objetivos de optimización para sistemas de IA en el borde y embebidos.
- Comprensión del uso del Núcleo de IA (AI Core) y la asignación de memoria.
Uso del Motor de Grafos para análisis
- Introducción al Motor de Grafos y la tubería de ejecución.
- Visualización de grafos de operadores y métricas de tiempo de ejecución.
- Modificación de grafos computacionales para la optimización.
Herramientas de perfilado y métricas de rendimiento
- Uso de la herramienta de perfilado de CANN (profiler) para el análisis de cargas de trabajo.
- Análisis del tiempo de ejecución de kernels y detección de cuellos de botella.
- Perfilado del acceso a memoria y estrategias de fragmentación (tiling).
Desarrollo de operadores personalizados con TIK
- \r
- Visión general de TIK y el modelo de programación de operadores.
- Implementación de un operador personalizado utilizando TIK DSL.
- Prueba y evaluación del rendimiento del operador.
Optimización avanzada de operadores con TVM
- Introducción a la integración de TVM con CANN.
- Estrategias de auto-ajuste (auto-tuning) para grafos computacionales.
- Cuándo y cómo cambiar entre TVM y TIK.
Técnicas de optimización de memoria
- Gestión del diseño de memoria y la colocación de búferes.
- Técnicas para reducir el consumo de memoria on-chip.
- Mejores prácticas para la ejecución asíncrona y la reutilización.
Implementación en el mundo real y estudios de caso
- Estudio de caso: ajuste de rendimiento para el pipeline de cámaras de ciudades inteligentes.
- Estudio de caso: optimización de la pila de inferencia para vehículos autónomos.
- Directrices para el perfilado iterativo y la mejora continua.
Resumen y siguientes pasos
Requerimientos
- Conocimiento sólido de las arquitecturas de modelos de aprendizaje profundo y los flujos de trabajo de entrenamiento.
- Experiencia en el despliegue de modelos utilizando CANN, TensorFlow o PyTorch.
- Familiaridad con la CLI de Linux, scripting de shell y programación en Python.
Público objetivo
- Ingenieros de rendimiento de IA.
- Especialistas en optimización de inferencia.
- Desarrolladores que trabajan con IA en el borde (edge AI) o sistemas en tiempo real.
14 Horas