Contacta con nosotros

Temario del curso

Introducción

  • ¿Qué es la programación GPU?
  • ¿Por qué utilizar la programación GPU?
  • ¿Cuáles son los desafíos y compromisos de la programación GPU?
  • ¿Cuáles son los marcos de trabajo y herramientas para la programación GPU?
  • Elegir el marco de trabajo y la herramienta adecuados para su aplicación.

OpenCL

  • ¿Qué es OpenCL?
  • ¿Cuáles son las ventajas y desventajas de OpenCL?
  • Configuración del entorno de desarrollo para OpenCL.
  • Creación de un programa básico de OpenCL que realiza una suma de vectores.
  • Uso de la API de OpenCL para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, iniciar kernels y sincronizar hilos.
  • Uso del lenguaje OpenCL C para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
  • Uso de funciones, variables y bibliotecas integradas de OpenCL para realizar tareas y operaciones comunes.
  • Uso de los espacios de memoria de OpenCL, como global, local, constante y privado, para optimizar las transferencias de datos y los accesos a la memoria.
  • Uso del modelo de ejecución de OpenCL para controlar los elementos de trabajo, grupos de trabajo y rangos ND que definen el paralelismo.
  • Depuración y prueba de programas OpenCL utilizando herramientas como CodeXL.
  • Optimización de programas OpenCL utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.

CUDA

  • ¿Qué es CUDA?
  • ¿Cuáles son las ventajas y desventajas de CUDA?
  • Configuración del entorno de desarrollo para CUDA.
  • Creación de un programa básico de CUDA que realiza una suma de vectores.
  • Uso de la API de CUDA para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, iniciar kernels y sincronizar hilos.
  • Uso del lenguaje CUDA C/C++ para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
  • Uso de funciones, variables y bibliotecas integradas de CUDA para realizar tareas y operaciones comunes.
  • Uso de los espacios de memoria de CUDA, como global, compartido, constante y local, para optimizar las transferencias de datos y los accesos a la memoria.
  • Uso del modelo de ejecución de CUDA para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
  • Depuración y prueba de programas CUDA utilizando herramientas como CUDA-GDB, CUDA-MEMCHECK y NVIDIA Nsight.
  • Optimización de programas CUDA utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.

ROCm

  • ¿Qué es ROCm?
  • ¿Cuáles son las ventajas y desventajas de ROCm?
  • Configuración del entorno de desarrollo para ROCm.
  • Creación de un programa básico de ROCm que realiza una suma de vectores.
  • Uso de la API de ROCm para consultar información del dispositivo, asignar y liberar memoria del dispositivo, copiar datos entre el host y el dispositivo, iniciar kernels y sincronizar hilos.
  • Uso del lenguaje ROCm C/C++ para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
  • Uso de funciones, variables y bibliotecas integradas de ROCm para realizar tareas y operaciones comunes.
  • Uso de los espacios de memoria de ROCm, como global, local, constante y privado, para optimizar las transferencias de datos y los accesos a la memoria.
  • Uso del modelo de ejecución de ROCm para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
  • Depuración y prueba de programas ROCm utilizando herramientas como el depurador ROCm y el perfilador ROCm.
  • Optimización de programas ROCm utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.

HIP

  • ¿Qué es HIP?
  • ¿Cuáles son las ventajas y desventajas de HIP?
  • Configuración del entorno de desarrollo para HIP.
  • Creación de un programa básico de HIP que realiza una suma de vectores.
  • Uso del lenguaje HIP para escribir kernels que se ejecutan en el dispositivo y manipulan datos.
  • Uso de funciones, variables y bibliotecas integradas de HIP para realizar tareas y operaciones comunes.
  • Uso de los espacios de memoria de HIP, como global, compartido, constante y local, para optimizar las transferencias de datos y los accesos a la memoria.
  • Uso del modelo de ejecución de HIP para controlar los hilos, bloques y cuadrículas que definen el paralelismo.
  • Depuración y prueba de programas HIP utilizando herramientas como el depurador ROCm y el perfilador ROCm.
  • Optimización de programas HIP utilizando técnicas como coalescencia, almacenamiento en caché, precarga y perfilado.

Comparación

  • Comparación de las características, rendimiento y compatibilidad de OpenCL, CUDA, ROCm e HIP.
  • Evaluación de programas GPU mediante puntos de referencia y métricas.
  • Aprendizaje de las mejores prácticas y consejos para la programación GPU.
  • Exploración de las tendencias actuales y futuras y los desafíos de la programación GPU.

Resumen y próximos pasos

Requerimientos

  • Conocimiento del lenguaje C/C++ y conceptos de programación en paralelo.
  • Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria.
  • Experiencia con herramientas de línea de comandos y editores de código.

Público objetivo

  • Desarrolladores que desean aprender los conceptos básicos de la programación GPU y los principales marcos de trabajo y herramientas para desarrollar aplicaciones GPU.
  • Desarrolladores que desean escribir código portátil y escalable que pueda ejecutarse en diferentes plataformas y dispositivos.
  • Programadores que desean explorar los beneficios y desafíos de la programación GPU y la optimización.
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas