Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción
- ¿Qué es la programación de GPU?
- ¿Por qué utilizar la programación de GPU?
- ¿Cuáles son los desafíos y compensaciones de la programación de GPU?
- ¿Qué marcos de trabajo existen para la programación de GPU?
- Elegir el marco de trabajo adecuado para su aplicación
OpenCL
- ¿Qué es OpenCL?
- ¿Cuáles son las ventajas y desventajas de OpenCL?
- Configuración del entorno de desarrollo para OpenCL
- Creación de un programa básico de OpenCL que realice la suma de vectores
- Uso de la API de OpenCL para consultar la información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos
- Uso del lenguaje OpenCL C para escribir kernels que se ejecuten en el dispositivo y manipulen datos
- Uso de las funciones, variables y bibliotecas integradas de OpenCL para realizar tareas y operaciones comunes
- Uso de los espacios de memoria de OpenCL, como global, local, constante y privado, para optimizar las transferencias de datos y los accesos a la memoria
- Uso del modelo de ejecución de OpenCL para controlar los elementos de trabajo, grupos de trabajo y rangos ND que definen el paralelismo
- Depuración y prueba de programas de OpenCL utilizando herramientas como CodeXL
- Optimización de programas de OpenCL utilizando técnicas como el entrelazado, la caché, la prefetching y la perfilación
CUDA
- ¿Qué es CUDA?
- ¿Cuáles son las ventajas y desventajas de CUDA?
- Configuración del entorno de desarrollo para CUDA
- Creación de un programa básico de CUDA que realice la suma de vectores
- Uso de la API de CUDA para consultar la información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos
- Uso del lenguaje CUDA C/C++ para escribir kernels que se ejecuten en el dispositivo y manipulen datos
- Uso de las funciones, variables y bibliotecas integradas de CUDA para realizar tareas y operaciones comunes
- Uso de los espacios de memoria de CUDA, como global, compartido, constante y local, para optimizar las transferencias de datos y los accesos a la memoria
- Uso del modelo de ejecución de CUDA para controlar los hilos, bloques y cuadrículas que definen el paralelismo
- Depuración y prueba de programas de CUDA utilizando herramientas como CUDA-GDB, CUDA-MEMCHECK y NVIDIA Nsight
- Optimización de programas de CUDA utilizando técnicas como el entrelazado, la caché, la prefetching y la perfilación
ROCm
- ¿Qué es ROCm?
- ¿Cuáles son las ventajas y desventajas de ROCm?
- Configuración del entorno de desarrollo para ROCm
- Creación de un programa básico de ROCm que realice la suma de vectores
- Uso de la API de ROCm para consultar la información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, lanzar kernels y sincronizar hilos
- Uso del lenguaje ROCm C/C++ para escribir kernels que se ejecuten en el dispositivo y manipulen datos
- Uso de las funciones, variables y bibliotecas integradas de ROCm para realizar tareas y operaciones comunes
- Uso de los espacios de memoria de ROCm, como global, local, constante y privado, para optimizar las transferencias de datos y los accesos a la memoria
- Uso del modelo de ejecución de ROCm para controlar los hilos, bloques y cuadrículas que definen el paralelismo
- Depuración y prueba de programas de ROCm utilizando herramientas como ROCm Debugger y ROCm Profiler
- Optimización de programas de ROCm utilizando técnicas como el entrelazado, la caché, la prefetching y la perfilación
Comparación
- Comparación de las características, rendimiento y compatibilidad de OpenCL, CUDA y ROCm
- Evaluación de programas de GPU mediante puntos de referencia y métricas
- Aprendizaje de las mejores prácticas y consejos para la programación de GPU
- Exploración de las tendencias y desafíos actuales y futuros de la programación de GPU
Resumen y próximos pasos
Requerimientos
- Comprensión del lenguaje C/C++ y conceptos de programación en paralelo.
- Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria.
- Experiencia con herramientas de línea de comandos y editores de código.
Público objetivo
- Desarrolladores que desean aprender a utilizar diferentes marcos de trabajo para la programación de GPU y comparar sus características, rendimiento y compatibilidad.
- Desarrolladores que desean escribir código portable y escalable que pueda ejecutarse en diferentes plataformas y dispositivos.
- Programadores que desean explorar las compensaciones y desafíos de la programación y optimización de GPU.
28 Horas