Contacta con nosotros

Temario del curso

Introducción

  • ¿Qué es OpenCL?
  • OpenCL vs CUDA vs SYCL
  • Visión general de las características y arquitectura de OpenCL
  • Configuración del entorno de desarrollo

Primeros pasos

  • Creación de un nuevo proyecto de OpenCL utilizando Visual Studio Code
  • Exploración de la estructura del proyecto y los archivos
  • Compilación y ejecución del programa
  • Visualización de la salida utilizando printf y fprintf

API de OpenCL

  • Comprensión del rol de la API de OpenCL en el programa del host
  • Uso de la API de OpenCL para consultar información y capacidades del dispositivo
  • Uso de la API de OpenCL para crear contextos, colas de comandos, búferes, kernels y eventos
  • Uso de la API de OpenCL para encolar comandos, como lectura, escritura, copia, mapeo, desmapeo, ejecución y espera
  • Uso de la API de OpenCL para manejar errores y excepciones

C de OpenCL

  • Comprensión del rol de C de OpenCL en el programa del dispositivo
  • Uso de C de OpenCL para escribir kernels que se ejecuten en el dispositivo y manipulen datos
  • Uso de tipos de datos, calificadores, operadores y expresiones de C de OpenCL
  • Uso de funciones integradas de C de OpenCL, como matemáticas, geométricas, relacionales, etc.
  • Uso de extensiones y bibliotecas de C de OpenCL, como atómicas, de imágenes, cl_khr_fp16, etc.

Modelo de memoria de OpenCL

  • Comprensión de la diferencia entre los modelos de memoria del host y del dispositivo
  • Uso de los espacios de memoria de OpenCL, como global, local, constante y privado
  • Uso de objetos de memoria de OpenCL, como búferes, imágenes y tuberías (pipes)
  • Uso de los modos de acceso a la memoria de OpenCL, como solo lectura, solo escritura, lectura-escritura, etc.
  • Uso del modelo de consistencia de memoria de OpenCL y mecanismos de sincronización

Modelo de ejecución de OpenCL

  • Comprensión de la diferencia entre los modelos de ejecución del host y del dispositivo
  • Uso de elementos de trabajo (work-items), grupos de trabajo y rangos ND de OpenCL para definir el paralelismo
  • Uso de funciones de elementos de trabajo de OpenCL, como get_global_id, get_local_id, get_group_id, etc.
  • Uso de funciones de grupos de trabajo de OpenCL, como barrier, work_group_reduce, work_group_scan, etc.
  • Uso de funciones de dispositivos de OpenCL, como get_num_groups, get_global_size, get_local_size, etc.

Depuración

  • Comprensión de los errores y errores comunes en programas de OpenCL
  • Uso del depurador de Visual Studio Code para inspeccionar variables, puntos de ruptura, pila de llamadas, etc.
  • Uso de CodeXL para depurar y analizar programas de OpenCL en dispositivos AMD
  • Uso de Intel VTune para depurar y analizar programas de OpenCL en dispositivos Intel
  • Uso de NVIDIA Nsight para depurar y analizar programas de OpenCL en dispositivos NVIDIA

Optimización

  • Comprensión de los factores que afectan el rendimiento de los programas de OpenCL
  • Uso de tipos de datos vectoriales y técnicas de vectorización de OpenCL para mejorar la capacidad de procesamiento aritmético
  • Uso de técnicas de desenrollado de bucles (loop unrolling) y alineación de bucles (loop tiling) de OpenCL para reducir la sobrecarga de control y aumentar la localidad
  • Uso de memoria local y funciones de memoria local de OpenCL para optimizar los accesos a la memoria y el ancho de banda
  • Uso de perfilado (profiling) y herramientas de perfilado de OpenCL para medir y mejorar el tiempo de ejecución y la utilización de recursos

Resumen y próximos pasos

Requerimientos

  • Comprensión del lenguaje C/C++ y de los conceptos de programación paralela.
  • Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria.
  • Experiencia con herramientas de línea de comandos y editores de código.

Audiencia objetivo

  • Desarrolladores que desean aprender a usar OpenCL para programar dispositivos heterogéneos y explotar su paralelismo.
  • Desarrolladores que desean escribir código portátil y escalable que pueda ejecutarse en diferentes plataformas y dispositivos.
  • Programadores que desean explorar los aspectos de bajo nivel de la programación heterogénea y optimizar el rendimiento de su código.
 28 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas