Contacta con nosotros

Temario del curso

Introducción

  • ¿Qué es CUDA?
  • CUDA vs OpenCL vs SYCL
  • Visión general de las características y arquitectura de CUDA
  • Configuración del entorno de desarrollo

Primeros pasos

  • Creación de un nuevo proyecto CUDA usando Visual Studio Code
  • Exploración de la estructura y archivos del proyecto
  • Compilación y ejecución del programa
  • Visualización de la salida usando printf y fprintf

API de CUDA

  • Comprensión del papel de la API de CUDA en el programa del host
  • Uso de la API de CUDA para consultar información y capacidades del dispositivo
  • Uso de la API de CUDA para asignar y liberar memoria del dispositivo
  • Uso de la API de CUDA para copiar datos entre el host y el dispositivo
  • Uso de la API de CUDA para lanzar kernels y sincronizar hilos
  • Uso de la API de CUDA para manejar errores y excepciones

CUDA C/C++

  • Comprensión del papel de CUDA C/C++ en el programa del dispositivo
  • Uso de CUDA C/C++ para escribir kernels que se ejecuten en la GPU y manipulen datos
  • Uso de tipos de datos, calificadores, operadores y expresiones de CUDA C/C++
  • Uso de funciones integradas de CUDA C/C++, como matemáticas, atómicas, warps, etc.
  • Uso de variables integradas de CUDA C/C++, como threadIdx, blockIdx, blockDim, etc.
  • Uso de bibliotecas de CUDA C/C++, como cuBLAS, cuFFT, cuRAND, etc.

Modelo de memoria de CUDA

  • Comprensión de la diferencia entre los modelos de memoria del host y del dispositivo
  • Uso de espacios de memoria de CUDA, como global, compartido, constante y local
  • Uso de objetos de memoria de CUDA, como punteros, matrices, texturas y superficies
  • Uso de modos de acceso a la memoria de CUDA, como solo lectura, solo escritura, lectura-escritura, etc.
  • Uso del modelo de consistencia de memoria de CUDA y mecanismos de sincronización

Modelo de ejecución de CUDA

  • Comprensión de la diferencia entre los modelos de ejecución del host y del dispositivo
  • Uso de hilos, bloques y cuadrículas de CUDA para definir el paralelismo
  • Uso de funciones de hilos de CUDA, como threadIdx, blockIdx, blockDim, etc.
  • Uso de funciones de bloques de CUDA, como __syncthreads, __threadfence_block, etc.
  • Uso de funciones de cuadrículas de CUDA, como gridDim, gridSync, grupos cooperativos, etc.

Depuración

  • Comprensión de los errores y fallos comunes en programas de CUDA
  • Uso del depurador de Visual Studio Code para inspeccionar variables, puntos de interrupción, pila de llamadas, etc.
  • Uso de CUDA-GDB para depurar programas de CUDA en Linux
  • Uso de CUDA-MEMCHECK para detectar errores y fugas de memoria
  • Uso de NVIDIA Nsight para depurar y analizar programas de CUDA en Windows

Optimización

  • Comprensión de los factores que afectan el rendimiento de los programas de CUDA
  • Uso de técnicas de coalescencia de CUDA para mejorar el ancho de banda de memoria
  • Uso de técnicas de almacenamiento en caché y prebúsqueda de CUDA para reducir la latencia de memoria
  • Uso de técnicas de memoria compartida y memoria local de CUDA para optimizar los accesos a la memoria y el ancho de banda
  • Uso de perfilado y herramientas de perfilado de CUDA para medir y mejorar el tiempo de ejecución y la utilización de recursos

Resumen y próximos pasos

Requerimientos

  • Comprensión del lenguaje C/C++ y conceptos de programación paralela
  • Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria
  • Experiencia con herramientas de línea de comandos y editores de código

Público objetivo

  • Desarrolladores que deseen aprender a usar CUDA para programar GPUs de NVIDIA y explotar su paralelismo
  • Desarrolladores que deseen escribir código de alto rendimiento y escalable que pueda ejecutarse en diferentes dispositivos CUDA
  • Programadores que deseen explorar los aspectos de bajo nivel de la programación de GPUs y optimizar el rendimiento de su código
 28 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas