Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction
- Qu'est-ce que OpenCL ?
- OpenCL vs CUDA vs SYCL
- Aperçu des fonctionnalités et de l'architecture d'OpenCL
- Configuration de l'environnement de développement
Démarrage
- Création d'un nouveau projet OpenCL à l'aide de Visual Studio Code
- Exploration de la structure du projet et des fichiers
- Compilation et exécution du programme
- Affichage de la sortie en utilisant printf et fprintf
API OpenCL
- Compréhension du rôle de l'API OpenCL dans le programme hôte
- Utilisation de l'API OpenCL pour interroger les informations et les capacités de l'appareil
- Utilisation de l'API OpenCL pour créer des contextes, des files d'attente de commandes, des tampons, des noyaux et des événements
- Utilisation de l'API OpenCL pour enfile des commandes, telles que lecture, écriture, copie, mappage, dé-mappage, exécution et attente
- Utilisation de l'API OpenCL pour gérer les erreurs et les exceptions
C OpenCL
- Compréhension du rôle de C OpenCL dans le programme appareil
- Utilisation de C OpenCL pour écrire des noyaux qui s'exécutent sur l'appareil et manipulent les données
- Utilisation des types de données, qualificateurs, opérateurs et expressions de C OpenCL
- Utilisation des fonctions intégrées de C OpenCL, telles que mathématiques, géométriques, relationnelles, etc.
- Utilisation des extensions et bibliothèques de C OpenCL, telles que atomique, image, cl_khr_fp16, etc.
Modèle de mémoire OpenCL
- Compréhension de la différence entre les modèles de mémoire hôte et appareil
- Utilisation des espaces mémoire OpenCL, tels que global, local, constant et privé
- Utilisation des objets mémoire OpenCL, tels que des tampons, des images et des tuyaux
- Utilisation des modes d'accès mémoire OpenCL, tels que lecture seule, écriture seule, lecture-écriture, etc.
- Utilisation du modèle de cohérence mémoire OpenCL et des mécanismes de synchronisation
Modèle d'exécution OpenCL
- Compréhension de la différence entre les modèles d'exécution hôte et appareil
- Utilisation des éléments de travail, groupes de travail et étendues ND d'OpenCL pour définir le parallélisme
- Utilisation des fonctions d'élément de travail OpenCL, telles que get_global_id, get_local_id, get_group_id, etc.
- Utilisation des fonctions de groupe de travail OpenCL, telles que barrier, work_group_reduce, work_group_scan, etc.
- Utilisation des fonctions d'appareil OpenCL, telles que get_num_groups, get_global_size, get_local_size, etc.
Débogage
- Compréhension des erreurs et bogies courants dans les programmes OpenCL
- Utilisation du débogueur de Visual Studio Code pour inspecter les variables, les points d'arrêt, la pile d'appels, etc.
- Utilisation de CodeXL pour déboguer et analyser les programmes OpenCL sur les appareils AMD
- Utilisation d'Intel VTune pour déboguer et analyser les programmes OpenCL sur les appareils Intel
- Utilisation de NVIDIA Nsight pour déboguer et analyser les programmes OpenCL sur les appareils NVIDIA
Optimisation
- Compréhension des facteurs qui affectent les performances des programmes OpenCL
- Utilisation des types de données vectorielles OpenCL et des techniques de vectorisation pour améliorer le débit arithmetic
- Utilisation des techniques de déroulage de boucles et de découpage de boucles OpenCL pour réduire la surcharge de contrôle et augmenter la localité
- Utilisation de la mémoire locale et des fonctions de mémoire locale OpenCL pour optimiser les accès mémoire et la bande passante
- Utilisation du profilage et des outils de profilage OpenCL pour mesurer et améliorer le temps d'exécution et l'utilisation des ressources
Résumé et prochaines étapes
Pré requis
- Une compréhension du langage C/C++ et des concepts de programmation parallèle.
- Des connaissances de base en architecture informatique et hiérarchie mémoire.
- De l'expérience avec les outils en ligne de commande et les éditeurs de code.
Public cible
- Développeurs souhaitant apprendre à utiliser OpenCL pour programmer des appareils hétérogènes et exploiter leur parallélisme.
- Développeurs souhaitant écrire du code portable et évolutif capable de s'exécuter sur différentes plateformes et appareils.
- Programmateurs souhaitant explorer les aspects bas niveau de la programmation hétérogène et optimiser les performances de leur code.
28 Heures