Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción
- ¿Qué es OpenCL?
- OpenCL vs CUDA vs SYCL
- Visión general de las características y arquitectura de OpenCL
- Configuración del entorno de desarrollo
Primeros pasos
- Creación de un nuevo proyecto de OpenCL utilizando Visual Studio Code
- Exploración de la estructura del proyecto y los archivos
- Compilación y ejecución del programa
- Visualización de la salida utilizando printf y fprintf
API de OpenCL
- Comprensión del rol de la API de OpenCL en el programa del host
- Uso de la API de OpenCL para consultar información y capacidades del dispositivo
- Uso de la API de OpenCL para crear contextos, colas de comandos, búferes, kernels y eventos
- Uso de la API de OpenCL para encolar comandos, como lectura, escritura, copia, mapeo, desmapeo, ejecución y espera
- Uso de la API de OpenCL para manejar errores y excepciones
C de OpenCL
- Comprensión del rol de C de OpenCL en el programa del dispositivo
- Uso de C de OpenCL para escribir kernels que se ejecuten en el dispositivo y manipulen datos
- Uso de tipos de datos, calificadores, operadores y expresiones de C de OpenCL
- Uso de funciones integradas de C de OpenCL, como matemáticas, geométricas, relacionales, etc.
- Uso de extensiones y bibliotecas de C de OpenCL, como atómicas, de imágenes, cl_khr_fp16, etc.
Modelo de memoria de OpenCL
- Comprensión de la diferencia entre los modelos de memoria del host y del dispositivo
- Uso de los espacios de memoria de OpenCL, como global, local, constante y privado
- Uso de objetos de memoria de OpenCL, como búferes, imágenes y tuberías (pipes)
- Uso de los modos de acceso a la memoria de OpenCL, como solo lectura, solo escritura, lectura-escritura, etc.
- Uso del modelo de consistencia de memoria de OpenCL y mecanismos de sincronización
Modelo de ejecución de OpenCL
- Comprensión de la diferencia entre los modelos de ejecución del host y del dispositivo
- Uso de elementos de trabajo (work-items), grupos de trabajo y rangos ND de OpenCL para definir el paralelismo
- Uso de funciones de elementos de trabajo de OpenCL, como get_global_id, get_local_id, get_group_id, etc.
- Uso de funciones de grupos de trabajo de OpenCL, como barrier, work_group_reduce, work_group_scan, etc.
- Uso de funciones de dispositivos de OpenCL, como get_num_groups, get_global_size, get_local_size, etc.
Depuración
- Comprensión de los errores y errores comunes en programas de OpenCL
- Uso del depurador de Visual Studio Code para inspeccionar variables, puntos de ruptura, pila de llamadas, etc.
- Uso de CodeXL para depurar y analizar programas de OpenCL en dispositivos AMD
- Uso de Intel VTune para depurar y analizar programas de OpenCL en dispositivos Intel
- Uso de NVIDIA Nsight para depurar y analizar programas de OpenCL en dispositivos NVIDIA
Optimización
- Comprensión de los factores que afectan el rendimiento de los programas de OpenCL
- Uso de tipos de datos vectoriales y técnicas de vectorización de OpenCL para mejorar la capacidad de procesamiento aritmético
- Uso de técnicas de desenrollado de bucles (loop unrolling) y alineación de bucles (loop tiling) de OpenCL para reducir la sobrecarga de control y aumentar la localidad
- Uso de memoria local y funciones de memoria local de OpenCL para optimizar los accesos a la memoria y el ancho de banda
- Uso de perfilado (profiling) y herramientas de perfilado de OpenCL para medir y mejorar el tiempo de ejecución y la utilización de recursos
Resumen y próximos pasos
Requerimientos
- Comprensión del lenguaje C/C++ y de los conceptos de programación paralela.
- Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria.
- Experiencia con herramientas de línea de comandos y editores de código.
Audiencia objetivo
- Desarrolladores que desean aprender a usar OpenCL para programar dispositivos heterogéneos y explotar su paralelismo.
- Desarrolladores que desean escribir código portátil y escalable que pueda ejecutarse en diferentes plataformas y dispositivos.
- Programadores que desean explorar los aspectos de bajo nivel de la programación heterogénea y optimizar el rendimiento de su código.
28 Horas