Optimización del rendimiento en Ascend, Biren y Cambricon
Ascend, Biren y Cambricon son las principales plataformas de hardware de IA en China, cada una ofreciendo herramientas únicas de aceleración y perfilado para cargas de trabajo de IA a escala de producción.
Esta capacitación en vivo impartida por un instructor (en línea o presencial) está dirigida a ingenieros de infraestructura y rendimiento de IA de nivel avanzado que desean optimizar los flujos de trabajo de inferencia y entrenamiento de modelos en múltiples plataformas de chips de IA chinos.
Al finalizar esta capacitación, los participantes podrán:
- Realizar pruebas de rendimiento de modelos en las plataformas Ascend, Biren y Cambricon.
- Identificar cuellos de botella del sistema e ineficiencias de memoria/cómputo.
- Aplicar optimizaciones a nivel de gráfico, de kernel y de operador.
- Configurar las canalizaciones de implementación para mejorar el rendimiento y la latencia.
Formato del curso
- Lección interactiva y discusión.
- Uso práctico de herramientas de perfilado y optimización en cada plataforma.
- Ejercicios guiados centrados en escenarios prácticos de configuración.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso basada en su entorno de rendimiento o tipo de modelo, contáctenos para coordinar los detalles.
Temario del curso
Conceptos y métricas de rendimiento
- Latencia, rendimiento, consumo de energía, utilización de recursos
- Cuellos de botella a nivel del sistema frente a nivel del modelo
- Perfilado para inferencia frente a entrenamiento
Perfilado en Huawei Ascend
- Uso del perfilador CANN y MindInsight
- Diagnóstico de kernels y operadores
- Patrones de descarga y mapeo de memoria
Perfilado en GPU Biren
- Funciones de monitoreo de rendimiento del SDK de Biren
- Fusión de kernels, alineación de memoria y colas de ejecución
- Perfilado consciente del consumo energético y la temperatura
Perfilado en Cambricon MLU
- Herramientas de rendimiento BANGPy y Neuware
- Visibilidad a nivel de kernel e interpretación de registros
- Integración del perfilador MLU con marcos de implementación
Optimización a nivel de gráfico y modelo
- Estrategias de poda de gráficos y cuantización
- Fusión de operadores y reestructuración del gráfico computacional
- Estandarización del tamaño de entrada y configuración de lotes
Optimización de memoria y kernel
- Optimización del diseño de memoria y reutilización
- Gestión eficiente de búferes entre diferentes conjuntos de chips
- Técnicas de ajuste de kernel específicas por plataforma
Mejores prácticas multiplataforma
- Portabilidad del rendimiento: estrategias de abstracción
- Creación de canalizaciones de configuración compartidas para entornos de múltiples chips
- Ejemplo: configuración de un modelo de detección de objetos en Ascend, Biren y MLU
Resumen y próximos pasos
Requerimientos
- Experiencia trabajando con canalizaciones de entrenamiento o implementación de modelos de IA
- Comprensión de los principios de cómputo GPU/MLU y optimización de modelos
- Conocimiento básico de herramientas y métricas de perfilado de rendimiento
Público objetivo
- Ingenieros de rendimiento
- Equipos de infraestructura de aprendizaje automático
- Arquitectos de sistemas de IA
Los cursos públicos requieren más de 5 participantes.
Optimización del rendimiento en Ascend, Biren y Cambricon - Reserva
Optimización del rendimiento en Ascend, Biren y Cambricon - Consulta
Optimización del rendimiento en Ascend, Biren y Cambricon - Solicitud de consultoría
Próximos cursos
Cursos Relacionados
Desarrollo de aplicaciones de IA con Huawei Ascend y CANN
21 HorasHuawei Ascend es una familia de procesadores de IA diseñados para inferencia y entrenamiento de alto rendimiento.
Este curso en vivo con instrucción presencial (en línea o en las instalaciones) está dirigido a ingenieros de IA y científicos de datos de nivel intermedio que deseen desarrollar y optimizar modelos de redes neuronales utilizando la plataforma Ascend de Huawei y el kit de herramientas CANN.
Al finalizar este curso, los participantes serán capaces de:
- Configurar y establecer el entorno de desarrollo de CANN.
- Desarrollar aplicaciones de IA utilizando flujos de trabajo de MindSpore y CloudMatrix.
- Optimizar el rendimiento en NPUs de Ascend mediante operadores personalizados y técnicas de fragmentación (tiling).
- Implementar modelos en entornos de borde o en la nube.
Formato del curso
- Conferencia interactiva y discusión en grupo.
- Práctica directa con Huawei Ascend y el kit de herramientas CANN en aplicaciones de ejemplo.
- Ejercicios guiados centrados en la construcción, entrenamiento e implementación de modelos.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su infraestructura o conjuntos de datos, por favor contáctenos para coordinarla.
Implementación de Modelos de IA con CANN y Procesadores de IA Ascend
14 HorasCANN (Compute Architecture for Neural Networks) es la pila de cálculo para IA de Huawei, diseñada para implementar y optimizar modelos de IA en procesadores Ascend.
Esta formación impartida por un instructor, con sesiones en vivo (en línea o presenciales), está dirigida a desarrolladores e ingenieros de IA de nivel intermedio que deseen implementar modelos de IA entrenados de manera eficiente en hardware Huawei Ascend, utilizando la herramienta CANN y otras como MindSpore, TensorFlow o PyTorch.
Al finalizar esta formación, los participantes podrán:
- Comprender la arquitectura de CANN y su papel en el flujo de trabajo de implementación de IA.
- Convertir y adaptar modelos de frameworks populares a formatos compatibles con Ascend.
- Utilizar herramientas como ATC, la conversión de modelos OM y MindSpore para inferencia en entornos edge y en la nube.
- Diagnosticar problemas de implementación y optimizar el rendimiento en hardware Ascend.
Formato del curso
- Clase interactiva y demostraciones.
- Trabajo práctico de laboratorio utilizando herramientas CANN y simuladores o dispositivos Ascend.
- Escenarios prácticos de implementación basados en modelos de IA del mundo real.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para organizarla.
Inferencia e implementación de IA con CloudMatrix
21 HorasCloudMatrix es la plataforma unificada de desarrollo e implementación de IA de Huawei, diseñada para apoyar tuberías de inferencia escalables y de nivel de producción.
Esta formación en vivo y dirigida por instructores (en línea o presencial) está dirigida a profesionales de la IA de nivel principiante a intermedio que deseen implementar y supervisar modelos de IA utilizando la plataforma CloudMatrix con integración de CANN y MindSpore.
Al final de esta formación, los participantes podrán:
- Utilizar CloudMatrix para el empaquetado, la implementación y el servicio de modelos.
- Convertir y optimizar modelos para conjuntos de chips Ascend.
- Configurar tuberías para tareas de inferencia en tiempo real y por lotes.
- Supervisar las implementaciones y ajustar el rendimiento en entornos de producción.
Formato del curso
- Conferencias interactivas y discusiones.
- Uso práctico de CloudMatrix con escenarios reales de implementación.
- Ejercicios guiados centrados en la conversión, la optimización y la escalabilidad.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su infraestructura de IA o entorno en la nube, contáctenos para coordinar los detalles.
Programación de GPU en Aceleradores AI de Biren
21 HorasLos Aceleradores AI de Biren son GPU de alto rendimiento diseñadas para cargas de trabajo de IA y HPC, con soporte para entrenamiento y inferencia a gran escala.
Este entrenamiento en vivo y dirigido por un instructor (en línea o presencial) está dirigido a desarrolladores de nivel intermedio a avanzado que deseen programar y optimizar aplicaciones utilizando la pila de GPU propietaria de Biren, con comparaciones prácticas con entornos basados en CUDA.
Al finalizar este entrenamiento, los participantes podrán:
- Comprender la arquitectura de la GPU de Biren y su jerarquía de memoria.
- Configurar el entorno de desarrollo y utilizar el modelo de programación de Biren.
- Traducir y optimizar código estilo CUDA para las plataformas de Biren.
- Aplicar técnicas de ajuste de rendimiento y depuración.
Formato del curso
- Conferencia interactiva y discusión.
- Uso práctico del SDK de Biren en cargas de trabajo de GPU de ejemplo.
- Ejercicios guiados centrados en la portabilidad y el ajuste de rendimiento.
Opciones de personalización del curso
- Para solicitar un entrenamiento personalizado para este curso basado en su pila de aplicaciones o necesidades de integración, contáctenos para coordinarlo.
Desarrollo con BANGPy y Neuware en unidades MLU de Cambricon
21 HorasLas unidades MLU (Machine Learning Units) de Cambricon son chips de IA especializados, optimizados para inferencia y entrenamiento en entornos de borde y centros de datos.
Esta formación en vivo, impartida por un instructor (online o presencial), está dirigida a desarrolladores de nivel intermedio que deseen crear e implementar modelos de IA utilizando el marco de trabajo BANGPy y el SDK de Neuware en hardware MLU de Cambricon.
Al finalizar esta capacitación, los participantes serán capaces de:
- Configurar y preparar los entornos de desarrollo de BANGPy y Neuware.
- Desarrollar y optimizar modelos basados en Python y C++ para unidades MLU de Cambricon.
- Implementar modelos en dispositivos de borde y centros de datos que ejecuten el tiempo de ejecución de Neuware.
- Integrar flujos de trabajo de aprendizaje automático con las funciones de aceleración específicas de MLU.
Formato del curso
- Conferencia interactiva y debate.
- Uso práctico de BANGPy y Neuware para desarrollo e implementación.
- Ejercicios guiados centrados en la optimización, integración y pruebas.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso según su modelo de dispositivo Cambricon o caso de uso, contáctenos para coordinarlo.
Introducción a CANN para desarrolladores de marcos de IA
7 HorasCANN (Compute Architecture for Neural Networks) es el kit de herramientas de computación de IA de Huawei, utilizado para compilar, optimizar y desplegar modelos de IA en procesadores de IA Ascend.
Esta formación en vivo con instructores (en línea o presencial) está dirigida a desarrolladores de IA de nivel principiante que desean comprender cómo CANN se integra en el ciclo de vida del modelo, desde el entrenamiento hasta el despliegue, y cómo interactúa con marcos de trabajo como MindSpore, TensorFlow y PyTorch.
Al finalizar esta formación, los participantes podrán:
- Comprender el propósito y la arquitectura del kit de herramientas CANN.
- Configurar un entorno de desarrollo con CANN y MindSpore.
- Convertir y desplegar un modelo de IA básico en hardware Ascend.
- Adquirir conocimientos fundamentales para futuros proyectos de optimización o integración con CANN.
Formato del curso
- Conferencia interactiva y discusión.
- Prácticas manuales con despliegue de modelos sencillos.
- Guía paso a paso por la cadena de herramientas de CANN y los puntos de integración.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar los detalles.
CANN para el despliegue de IA en el borde
14 HorasEl kit de herramientas Ascend CANN de Huawei permite una potente inferencia de IA en dispositivos de borde, como el Ascend 310. CANN proporciona las herramientas esenciales para compilar, optimizar y desplegar modelos en entornos con recursos de cómputo y memoria limitados.
Esta formación impartida por instructores, disponible en formato en vivo (en línea o presencial), está dirigida a desarrolladores e integradores de IA de nivel intermedio que deseen desplegar y optimizar modelos en dispositivos de borde Ascend utilizando la cadena de herramientas CANN.
Al finalizar esta formación, los participantes serán capaces de:
- Preparar y convertir modelos de IA para el Ascend 310 utilizando las herramientas de CANN.
- Construir pipelines de inferencia ligeros utilizando MindSpore Lite y AscendCL.
- Optimizar el rendimiento del modelo para entornos con capacidad de cómputo y memoria limitadas.
- Desplegar y monitorear aplicaciones de IA en casos de uso reales en el borde.
Formato del curso
- Conferencia interactiva y demostraciones.
- Prácticas de laboratorio con modelos y escenarios específicos para el borde.
- Ejemplos de despliegue en vivo en hardware de borde virtual o físico.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinarlo.
Comprender la Pila de Cómputo de IA de Huawei: Desde CANN hasta MindSpore
14 HorasLa pila de IA de Huawei, desde el SDK de bajo nivel CANN hasta el framework de alto nivel MindSpore, ofrece un entorno de desarrollo e implementación de IA estrechamente integrado, optimizado para el hardware Ascend.
Esta capacitación en vivo impartida por un instructor (en línea o presencial) está dirigida a profesionales técnicos de nivel principiante a intermedio que deseen comprender cómo los componentes CANN y MindSpore trabajan juntos para respaldar la gestión del ciclo de vida de la IA y las decisiones de infraestructura.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura en capas de la pila de cómputo de IA de Huawei.
- Identificar cómo CANN admite la optimización de modelos y la implementación a nivel de hardware.
- Evaluar el framework MindSpore y su conjunto de herramientas en relación con las alternativas de la industria.
- Ubicar la pila de IA de Huawei dentro de entornos empresariales o de nube/instalación propia (on-prem).
Formato del Curso
- Conferencia interactiva y discusión.
- Demostraciones en vivo del sistema y recorridos basados en casos.
- Laboratorios guiados opcionales sobre el flujo de modelos desde MindSpore hasta CANN.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinar.
Optimización del rendimiento de redes neuronales con el SDK CANN
14 HorasEl SDK CANN (Compute Architecture for Neural Networks) es la base de cómputo de IA de Huawei que permite a los desarrolladores ajustar y optimizar el rendimiento de las redes neuronales implementadas en procesadores de IA Ascend.
Esta formación en vivo con instrucción directa (en línea o en las instalaciones) está dirigida a desarrolladores de IA y ingenieros de sistemas de nivel avanzado que desean optimizar el rendimiento de la inferencia utilizando la avanzada suite de herramientas de CANN, incluyendo el Motor de Grafos (Graph Engine), TIK y el desarrollo de operadores personalizados.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura de tiempo de ejecución de CANN y su ciclo de vida de rendimiento.
- Utilizar herramientas de perfilado y el Motor de Grafos para el análisis y la optimización del rendimiento.
- Crear y optimizar operadores personalizados utilizando TIK y TVM.
- Resolver cuellos de botella de memoria y mejorar el rendimiento (throughput) de los modelos.
Formato del curso
- Clase interactiva y discusión.
- Laboratorios prácticos con perfilado en tiempo real y ajuste de operadores.
- Ejercicios de optimización utilizando ejemplos de despliegue en casos límite (edge-case).
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar los detalles.
SDK CANN para Pipelines de Visión por Computadora y PLN
14 HorasEl SDK CANN (Compute Architecture for Neural Networks) ofrece herramientas potentes de implementación y optimización para aplicaciones de IA en tiempo real en visión por computadora y PLN (Procesamiento de Lenguaje Natural), especialmente en hardware Huawei Ascend.
Esta formación en vivo con instructor (en línea o presencial) está dirigida a profesionales de IA de nivel intermedio que desean construir, implementar y optimizar modelos de visión y lenguaje utilizando el SDK CANN para casos de uso en producción.
Al finalizar esta formación, los participantes podrán:
- Implementar y optimizar modelos de CV y PLN utilizando CANN y AscendCL.
- Utilizar las herramientas de CANN para convertir modelos e integrarlos en pipelines en vivo.
- Optimizar el rendimiento de la inferencia para tareas como detección, clasificación y análisis de sentimiento.
- Construir pipelines de CV/PLN en tiempo real para escenarios de implementación en el edge o en la nube.
Formato del curso
- Conferencia interactiva y demostración.
- Laboratorio práctico con implementación de modelos y perfilado de rendimiento.
- Diseño de pipelines en vivo utilizando casos de uso reales de CV y PLN.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinarla.
Construcción de Operadores de IA Personalizados con CANN TIK y TVM
14 HorasCANN TIK (Tensor Instruction Kernel) y Apache TVM permiten una optimización avanzada y la personalización de operadores de modelos de IA para el hardware Huawei Ascend.
Esta formación en vivo con instrucción presencial (en línea o en sitio) está dirigida a desarrolladores de sistemas de nivel avanzado que deseen crear, implementar y ajustar operadores personalizados para modelos de IA utilizando el modelo de programación TIK de CANN y la integración del compilador TVM.
Al finalizar esta capacitación, los participantes podrán:
- Escribir y probar operadores de IA personalizados utilizando el DSL de TIK para procesadores Ascend.
- Integrar operaciones personalizadas en el tiempo de ejecución y el gráfico de ejecución de CANN.
- Utilizar TVM para la programación de operadores, la auto-optimización y la medición de rendimiento.
- Depurar y optimizar el rendimiento a nivel de instrucciones para patrones de cómputo personalizados.
Formato del Curso
- Conferencia interactiva y demostración.
- Práctica de codificación de operadores utilizando los pipelines de TIK y TVM.
- Pruebas y ajuste en hardware Ascend o simuladores.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para organizarla.
Migración de aplicaciones CUDA a arquitecturas de GPU chinas
21 HorasLas arquitecturas de GPU chinas, como Huawei Ascend, Biren y las MLU de Cambricon, ofrecen alternativas a CUDA adaptadas para los mercados locales de IA y computación de alto rendimiento (HPC).
Esta formación en vivo, impartida por instructores (en línea o presencial), está dirigida a programadores de GPU de nivel avanzado y especialistas en infraestructura que deseen migrar y optimizar aplicaciones CUDA existentes para su implementación en plataformas de hardware chinas.
Al finalizar esta formación, los participantes podrán:
- Evaluar la compatibilidad de las cargas de trabajo CUDA existentes con las alternativas de chips chinos.
- Transferir las bases de código CUDA a los entornos Huawei CANN, Biren SDK y BANGPy de Cambricon.
- Comparar el rendimiento e identificar puntos de optimización entre plataformas.
- Abordar los desafíos prácticos en el soporte multiarquitectura y la implementación.
Formato del curso
- Clase interactiva y discusión.
- Talleres prácticos de traducción de código y comparación de rendimiento.
- Ejercicios guiados centrados en estrategias de adaptación multi-GPU.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su plataforma o proyecto CUDA, contáctenos para coordinarlo.