Programación de GPU: OpenCL frente a CUDA frente a ROCm

La programación de GPU es una técnica que aprovecha la potencia de procesamiento en paralelo de las GPUs para acelerar aplicaciones que requieren computación de alto rendimiento, como la inteligencia artificial, los juegos, la gráficos y la computación científica. Existen varios marcos de trabajo que permiten la programación de GPU, cada uno con sus propias ventajas y desventajas. OpenCL es un estándar abierto que se puede utilizar para programar CPUs, GPUs y otros dispositivos de diferentes proveedores, mientras que CUDA es específico para las GPUs de NVIDIA. ROCm es una plataforma que admite la programación de GPU en las GPUs de AMD y también proporciona compatibilidad con CUDA y OpenCL.

Esta formación en vivo con instructor (en línea o presencial) está dirigida a desarrolladores de nivel principiante a intermedio que desean utilizar diferentes marcos de trabajo para la programación de GPU y comparar sus características, rendimiento y compatibilidad.

Al final de esta formación, los participantes serán capaces de:

Configurar un entorno de desarrollo que incluya el SDK de OpenCL, el Kit de herramientas de CUDA, la Plataforma ROCm, un dispositivo que admita OpenCL, CUDA o ROCm, y Visual Studio Code.
Crear un programa de GPU básico que realice la suma de vectores utilizando OpenCL, CUDA y ROCm, y comparar la sintaxis, la estructura y la ejecución de cada marco de trabajo.
Utilizar las API respectivas para consultar la información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos.
Utilizar los respectivos lenguajes para escribir kernels que se ejecuten en el dispositivo y manipulen datos.
Utilizar las funciones, variables y bibliotecas integradas respectivas para realizar tareas y operaciones comunes.
Utilizar los respectivos espacios de memoria, como global, local, constante y privado, para optimizar las transferencias de datos y los accesos a la memoria.
Utilizar los respectivos modelos de ejecución para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
Depurar y probar programas de GPU utilizando herramientas como CodeXL, CUDA-GDB, CUDA-MEMCHECK y NVIDIA Nsight.
Optimizar programas de GPU utilizando técnicas como el entrelazado, la caché, la prefetching y la perfilación.

Formato del curso

Conferencia y discusión interactivas.
Muchas ejercicios y práctica.
Implementación práctica en un entorno de laboratorio en vivo.

Opciones de personalización del curso

Para solicitar una formación personalizada para este curso, contáctenos para coordinarla.

San José - Boulevard Dent

11275 USD (En línea)

13275 USD (Presencial)

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Temario del curso

Requerimientos

Próximos cursos

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Temario del curso

Requerimientos

Próximos cursos

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Programación de GPU: OpenCL frente a CUDA frente a ROCm

Cursos Relacionados

Desarrollo de aplicaciones de IA con Huawei Ascend y CANN

Implementación de Modelos de IA con CANN y Procesadores de IA Ascend

Inferencia e implementación de IA con CloudMatrix

Programación de GPU en Aceleradores AI de Biren

Desarrollo con BANGPy y Neuware en unidades MLU de Cambricon

Introducción a CANN para desarrolladores de marcos de IA

CANN para el despliegue de IA en el borde

Comprender la Pila de Cómputo de IA de Huawei: Desde CANN hasta MindSpore

Optimización del rendimiento de redes neuronales con el SDK CANN

SDK CANN para Pipelines de Visión por Computadora y PLN

Construcción de Operadores de IA Personalizados con CANN TIK y TVM

Migración de aplicaciones CUDA a arquitecturas de GPU chinas

Optimización del rendimiento en Ascend, Biren y Cambricon

Categorías Relacionadas

GPU

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites