Contacta con nosotros

Temario del curso

Visión general de las capacidades de optimización de CANN

  • Cómo se maneja el rendimiento de la inferencia en CANN.
  • Objetivos de optimización para sistemas de IA en el borde y embebidos.
  • Comprensión del uso del Núcleo de IA (AI Core) y la asignación de memoria.

Uso del Motor de Grafos para análisis

  • Introducción al Motor de Grafos y la tubería de ejecución.
  • Visualización de grafos de operadores y métricas de tiempo de ejecución.
  • Modificación de grafos computacionales para la optimización.

Herramientas de perfilado y métricas de rendimiento

  • Uso de la herramienta de perfilado de CANN (profiler) para el análisis de cargas de trabajo.
  • Análisis del tiempo de ejecución de kernels y detección de cuellos de botella.
  • Perfilado del acceso a memoria y estrategias de fragmentación (tiling).

Desarrollo de operadores personalizados con TIK

    \r
  • Visión general de TIK y el modelo de programación de operadores.
  • Implementación de un operador personalizado utilizando TIK DSL.
  • Prueba y evaluación del rendimiento del operador.

Optimización avanzada de operadores con TVM

  • Introducción a la integración de TVM con CANN.
  • Estrategias de auto-ajuste (auto-tuning) para grafos computacionales.
  • Cuándo y cómo cambiar entre TVM y TIK.

Técnicas de optimización de memoria

  • Gestión del diseño de memoria y la colocación de búferes.
  • Técnicas para reducir el consumo de memoria on-chip.
  • Mejores prácticas para la ejecución asíncrona y la reutilización.

Implementación en el mundo real y estudios de caso

  • Estudio de caso: ajuste de rendimiento para el pipeline de cámaras de ciudades inteligentes.
  • Estudio de caso: optimización de la pila de inferencia para vehículos autónomos.
  • Directrices para el perfilado iterativo y la mejora continua.

Resumen y siguientes pasos

Requerimientos

  • Conocimiento sólido de las arquitecturas de modelos de aprendizaje profundo y los flujos de trabajo de entrenamiento.
  • Experiencia en el despliegue de modelos utilizando CANN, TensorFlow o PyTorch.
  • Familiaridad con la CLI de Linux, scripting de shell y programación en Python.

Público objetivo

  • Ingenieros de rendimiento de IA.
  • Especialistas en optimización de inferencia.
  • Desarrolladores que trabajan con IA en el borde (edge AI) o sistemas en tiempo real.
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas