Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción
- ¿Qué es la programación GPU?
- ¿Por qué utilizar la programación GPU?
- ¿Cuáles son los desafíos y compromisos de la programación GPU?
- ¿Cuáles son los marcos de trabajo y herramientas para la programación GPU?
- Elegir el marco de trabajo y la herramienta adecuados para su aplicación.
OpenCL
- ¿Qué es OpenCL?
- ¿Cuáles son las ventajas y desventajas de OpenCL?
- Configuración del entorno de desarrollo para OpenCL.
- Creación de un programa básico de OpenCL que realiza una suma de vectores.
- Uso de la API de OpenCL para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, iniciar kernels y sincronizar hilos.
- Uso del lenguaje OpenCL C para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
- Uso de funciones, variables y bibliotecas integradas de OpenCL para realizar tareas y operaciones comunes.
- Uso de los espacios de memoria de OpenCL, como global, local, constante y privado, para optimizar las transferencias de datos y los accesos a la memoria.
- Uso del modelo de ejecución de OpenCL para controlar los elementos de trabajo, grupos de trabajo y rangos ND que definen el paralelismo.
- Depuración y prueba de programas OpenCL utilizando herramientas como CodeXL.
- Optimización de programas OpenCL utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.
CUDA
- ¿Qué es CUDA?
- ¿Cuáles son las ventajas y desventajas de CUDA?
- Configuración del entorno de desarrollo para CUDA.
- Creación de un programa básico de CUDA que realiza una suma de vectores.
- Uso de la API de CUDA para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, iniciar kernels y sincronizar hilos.
- Uso del lenguaje CUDA C/C++ para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
- Uso de funciones, variables y bibliotecas integradas de CUDA para realizar tareas y operaciones comunes.
- Uso de los espacios de memoria de CUDA, como global, compartido, constante y local, para optimizar las transferencias de datos y los accesos a la memoria.
- Uso del modelo de ejecución de CUDA para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
- Depuración y prueba de programas CUDA utilizando herramientas como CUDA-GDB, CUDA-MEMCHECK y NVIDIA Nsight.
- Optimización de programas CUDA utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.
ROCm
- ¿Qué es ROCm?
- ¿Cuáles son las ventajas y desventajas de ROCm?
- Configuración del entorno de desarrollo para ROCm.
- Creación de un programa básico de ROCm que realiza una suma de vectores.
- Uso de la API de ROCm para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, iniciar kernels y sincronizar hilos.
- Uso del lenguaje ROCm C/C++ para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
- Uso de funciones, variables y bibliotecas integradas de ROCm para realizar tareas y operaciones comunes.
- Uso de los espacios de memoria de ROCm, como global, local, constante y privado, para optimizar las transferencias de datos y los accesos a la memoria.
- Uso del modelo de ejecución de ROCm para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
- Depuración y prueba de programas ROCm utilizando herramientas como el depurador ROCm y el perfilador ROCm.
- Optimización de programas ROCm utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.
HIP
- ¿Qué es HIP?
- ¿Cuáles son las ventajas y desventajas de HIP?
- Configuración del entorno de desarrollo para HIP.
- Creación de un programa básico de HIP que realiza una suma de vectores.
- Uso del lenguaje HIP para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
- Uso de funciones, variables y bibliotecas integradas de HIP para realizar tareas y operaciones comunes.
- Uso de los espacios de memoria de HIP, como global, compartido, constante y local, para optimizar las transferencias de datos y los accesos a la memoria.
- Uso del modelo de ejecución de HIP para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
- Depuración y prueba de programas HIP utilizando herramientas como el depurador ROCm y el perfilador ROCm.
- Optimización de programas HIP utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.
Comparación
- Comparación de las características, rendimiento y compatibilidad de OpenCL, CUDA, ROCm e HIP.
- Evaluación de programas GPU mediante puntos de referencia y métricas.
- Aprendizaje de las mejores prácticas y consejos para la programación GPU.
- Exploración de las tendencias actuales y futuras y los desafíos de la programación GPU.
Resumen y próximos pasos
Requerimientos
- Conocimiento del lenguaje C/C++ y conceptos de programación en paralelo.
- Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria.
- Experiencia con herramientas de línea de comandos y editores de código.
Público objetivo
- Desarrolladores que desean aprender los conceptos básicos de la programación GPU y los principales marcos de trabajo y herramientas para desarrollar aplicaciones GPU.
- Desarrolladores que desean escribir código portátil y escalable que pueda ejecutarse en diferentes plataformas y dispositivos.
- Programadores que desean explorar los beneficios y desafíos de la programación GPU y la optimización.
21 Horas