Formation Programmation GPU avec OpenACC
OpenACC est une norme ouverte pour la programmation hétérogène qui permet à un code de s'exécuter sur différentes plateformes et dispositifs, tels que les CPU multicœurs, les GPU, les FPGA et d'autres.
Cette formation en présentiel, animée par un formateur (en ligne ou sur site), s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenACC pour programmer des dispositifs hétérogènes et exploiter leur parallélisme.
À l'issue de cette formation, les participants seront capables de :
- Configurer un environnement de développement OpenACC.
- Rédiger et exécuter un programme OpenACC de base.
- Annoter le code avec des directives et des clauses OpenACC.
- Utiliser l'API et les bibliothèques OpenACC.
- Profiler, déboguer et optimiser les programmes OpenACC.
Format de la formation
- Cours interactif et discussions.
- De nombreux exercices et pratiques.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation de la formation
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Plan du cours
Introduction
- Qu'est-ce que OpenACC ?
- OpenACC vs OpenCL vs CUDA vs SYCL
- Aperçu des fonctionnalités et de l'architecture d'OpenACC
- Configuration de l'environnement de développement
Premiers pas
- Création d'un projet OpenACC dans Visual Studio Code
- Exploration de la structure du projet et des fichiers
- Compilation et exécution du programme
- Affichage de la sortie avec printf et fprintf
Directives et clauses OpenACC
- Comprendre les directives et les clauses OpenACC
- Utilisation des directives parallèles pour créer des régions parallèles
- Utilisation des directives kernels pour le parallélisme géré par le compilateur
- Utilisation des directives de boucle pour paralléliser les boucles
- Gestion des mouvements de données avec les directives de données
- Synchronisation des données avec les directives de mise à jour
- Amélioration de la réutilisation des données avec les directives de cache
- Création de fonctions de dispositif avec les directives de routine
- Synchronisation des événements avec les directives d'attente
API OpenACC
- Compréhension du rôle de l'API OpenACC
- Interrogation des informations et des capacités du dispositif
- Définir le numéro et le type de dispositif
- Gestion des erreurs et des exceptions
- Création et synchronisation des événements
Bibliothèques et interopérabilité OpenACC
- Compréhension des bibliothèques OpenACC et de l'interopérabilité
- Utilisation des bibliothèques mathématiques, aléatoires et complexes
- Intégration avec d'autres modèles (CUDA, OpenMP, MPI)
- Intégration avec les bibliothèques GPU (cuBLAS, cuFFT)
Outils OpenACC
- Compréhension des outils OpenACC dans le développement
- Profiling et débogage des programmes OpenACC
- Analyse des performances avec le compilateur PGI, NVIDIA Nsight Systems, Allinea Forge
Optimisation
- Facteurs influençant les performances des programmes OpenACC
- Optimisation de la localité des données et réduction des transferts
- Optimisation du parallélisme des boucles et de la fusion
- Optimisation du parallélisme des kernels et de la fusion
- Optimisation de la vectorisation et de l'auto-réglage
Résumé et prochaines étapes
Pré requis
- Une compréhension des langages C/C++ ou Fortran et des concepts de programmation parallèle
- Des connaissances de base en architecture informatique et hiérarchie de mémoire
- Une expérience avec les outils en ligne de commande et les éditeurs de code
Audience
- Développeurs qui souhaitent apprendre à utiliser OpenACC pour programmer des dispositifs hétérogènes et exploiter leur parallélisme
- Développeurs qui souhaitent écrire un code portable et évolutif pouvant s'exécuter sur différentes plateformes et dispositifs
- Programmeurs qui souhaitent explorer les aspects de haut niveau de la programmation hétérogène et optimiser la productivité de leur code
Les formations ouvertes requièrent plus de 3 participants.
Formation Programmation GPU avec OpenACC - Réservation
Formation Programmation GPU avec OpenACC - Demande de renseignements
Programmation GPU avec OpenACC - Demande d'informations consulting
Cours à venir
Cours Similaires
Développement d'applications IA avec Huawei Ascend et CANN
21 HeuresHuawei Ascend est une gamme de processeurs IA conçus pour l'inférence et l'entraînement haute performance.
Cette formation pratique, animée par un formateur (en ligne ou sur site), s'adresse aux ingénieurs IA et aux data scientists de niveau intermédiaire souhaitant développer et optimiser des modèles de réseaux neuronaux à l'aide de la plateforme Huawei Ascend et de la boîte à outils CANN.
À l'issue de cette formation, les participants seront capables de :
- Installer et configurer l'environnement de développement CANN.
- Développer des applications IA en utilisant les flux de travail MindSpore et CloudMatrix.
- Optimiser les performances sur les NPU Ascend à l'aide d'opérateurs personnalisés et du tuilage (tiling).
- Déployer des modèles dans des environnements edge ou cloud.
Format du cours
- Cours interactif et échanges.
- Manipulation pratique des outils Huawei Ascend et CANN sur des applications d'exemple.
- Exercices guidés axés sur la construction, l'entraînement et le déploiement de modèles.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, basée sur votre infrastructure ou vos jeux de données, veuillez nous contacter pour organiser cela.
Déploiement de modèles d'IA avec CANN et les processeurs IA Ascend
14 HeuresCANN (Compute Architecture for Neural Networks) est la pile de calcul IA de Huawei, conçue pour déployer et optimiser les modèles d'IA sur les processeurs IA Ascend.
Cette formation en présentiel ou à distance, animée par un formateur, s'adresse aux développeurs et ingénieurs en IA de niveau intermédiaire souhaitant déployer efficacement des modèles d'IA entraînés sur le matériel Huawei Ascend, en utilisant la boîte à outils CANN ainsi que des outils tels que MindSpore, TensorFlow ou PyTorch.
À l'issue de cette formation, les participants seront capables de :
- Comprendre l'architecture de CANN et son rôle dans le pipeline de déploiement de l'IA.
- Convertir et adapter des modèles issus de frameworks populaires vers des formats compatibles avec Ascend.
- Utiliser des outils tels que ATC, la conversion de modèles OM et MindSpore pour l'inférence en périphérie et dans le cloud.
- Diagnostiquer les problèmes de déploiement et optimiser les performances sur le matériel Ascend.
Format de la formation
- Cours interactif accompagné de démonstrations.
- Travaux pratiques avec les outils CANN et des simulateurs ou appareils Ascend.
- Scénarios de déploiement concrets basés sur des modèles d'IA réels.
Options de personnalisation de la formation
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin de l'organiser.
Inférence et déploiement avec CloudMatrix
21 HeuresCloudMatrix est la plateforme unifiée de développement et de déploiement d'IA de Huawei, conçue pour prendre en charge des pipelines d'inférence évolutifs et prêts pour la production.
Cette formation en direct animée par un formateur (en ligne ou sur site) s'adresse aux professionnels de l'IA de niveau débutant à intermédiaire souhaitant déployer et surveiller des modèles d'IA à l'aide de la plateforme CloudMatrix, avec une intégration de CANN et MindSpore.
À l'issue de cette formation, les participants seront capables de :
- Utiliser CloudMatrix pour l'emballage, le déploiement et la mise à disposition des modèles.
- Convertir et optimiser les modèles pour les jeux de puces Ascend.
- Configurer des pipelines pour les tâches d'inférence en temps réel et par lots.
- Surveiller les déploiements et ajuster les performances dans des environnements de production.
Format du cours
- Cours interactif et discussions.
- Prise en main de CloudMatrix avec des scénarios de déploiement réels.
- Exercices guidés axés sur la conversion, l'optimisation et la mise à l'échelle.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, basée sur votre infrastructure d'IA ou votre environnement cloud, veuillez nous contacter pour organiser cela.
Programmation GPU sur les accélérateurs IA Biren
21 HeuresLes accélérateurs IA Biren sont des GPU hautes performances conçus pour les charges de travail d'IA et HPC, prenant en charge l'entraînement et l'inférence à grande échelle.
Cette formation en direct, animée par un formateur (en ligne ou sur site), s'adresse aux développeurs de niveau intermédiaire à avancé souhaitant programmer et optimiser des applications à l'aide de la pile GPU propriétaire de Biren, avec des comparaisons pratiques par rapport aux environnements basés sur CUDA.
À l'issue de cette formation, les participants seront en mesure de :
- Comprendre l'architecture des GPU Biren et leur hiérarchie mémoire.
- Configurer l'environnement de développement et utiliser le modèle de programmation de Biren.
- Traduire et optimiser le code de style CUDA pour les plateformes Biren.
- Appliquer des techniques de réglage des performances et de débogage.
Format du cours
- Conférence interactive et discussion.
- Utilisation pratique du SDK Biren sur des exemples de charges de travail GPU.
- Exercices guidés axés sur le portage et le réglage des performances.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours basée sur votre pile d'applications ou vos besoins d'intégration, veuillez nous contacter pour organiser cela.
Développement avec MLU de Cambricon via BANGPy et Neuware
21 HeuresLes UIM (Unités d'Informatique pour l'IA) de Cambricon sont des puces spécialisées dans le domaine de l'IA, optimisées pour l'inférence et l'entraînement dans des contextes de périphérie (edge) et de centres de données.
Ce training animé par un instructeur (en ligne ou en présentiel) s'adresse aux développeurs de niveau intermédiaire souhaitant construire et déployer des modèles d'IA en utilisant le framework BANGPy et le SDK Neuware sur du matériel Cambricon MLU.
À l'issue de ce training, les participants seront capables de :
- Configurer et mettre en place les environnements de développement BANGPy et Neuware.
- Développer et optimiser des modèles basés sur Python et/ou C++ pour les UIM Cambricon.
- Déployer des modèles sur des périphériques de périphérie et de centres de données fonctionnant avec le runtime Neuware.
- Intégrer les workflows ML avec les fonctionnalités d'accélération spécifiques aux UIM.
Format du cours
- Conférences interactives et discussions.
- Pratique de BANGPy et Neuware pour le développement et le déploiement.
- Exercices guidés axés sur l'optimisation, l'intégration et les tests.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours basée sur votre modèle d'appareil Cambricon ou votre cas d'utilisation, veuillez nous contacter pour convenir des détails.
Introduction à CANN pour les développeurs de frameworks IA
7 HeuresCANN (Compute Architecture for Neural Networks) est la boîte à outils de calcul IA de Huawei, utilisée pour compiler, optimiser et déployer des modèles IA sur les processeurs IA Ascend.
Cette formation en présentiel ou en ligne, animée par un instructeur, s'adresse aux développeurs IA débutants souhaitant comprendre comment CANN s'intègre dans le cycle de vie des modèles, de l'entraînement au déploiement, et comment il interagit avec des frameworks tels que MindSpore, TensorFlow et PyTorch.
À l'issue de cette formation, les participants seront en mesure de :
- Comprendre l'objectif et l'architecture de la boîte à outils CANN.
- Configurer un environnement de développement avec CANN et MindSpore.
- Convertir et déployer un modèle IA simple sur du matériel Ascend.
- Acquérir des connaissances fondamentales pour de futurs projets d'optimisation ou d'intégration avec CANN.
Format du cours
- Cours interactif et discussions.
- Travaux pratiques avec déploiement de modèles simples.
- Défilement étape par étape de la chaîne d'outils CANN et des points d'intégration.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Déploiement de l'IA sur la périphérie avec CANN
14 HeuresLa boîte à outils Ascend CANN de Huawei permet d'exécuter des inférences IA puissantes sur des appareils périphériques tels que l'Ascend 310. CANN fournit les outils essentiels pour compiler, optimiser et déployer des modèles dans des environnements où les ressources de calcul et la mémoire sont limitées.
Cette formation en direct, dispensée par un instructeur (en ligne ou sur site), s'adresse aux développeurs et intégrateurs de niveau intermédiaire en IA qui souhaitent déployer et optimiser des modèles sur des appareils périphériques Ascend en utilisant la chaîne d'outils CANN.
À l'issue de cette formation, les participants seront capables :
- De préparer et convertir des modèles IA pour l'Ascend 310 en utilisant les outils CANN.
- De créer des pipelines d'inférence légers grâce à MindSpore Lite et AscendCL.
- D'optimiser les performances des modèles pour des environnements avec des ressources de calcul et de mémoire limitées.
- De déployer et surveiller des applications IA dans des cas d'usage périphériques réels.
Format du cours
- Conférence interactive et démonstrations.
- Travaux pratiques avec des modèles et scénarios spécifiques à la périphérie.
- Déploiements en direct sur du matériel périphérique virtuel ou physique.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin d'en convenir.
Comprendre la pile de calcul IA de Huawei : de CANN à MindSpore
14 HeuresLa pile IA de Huawei — allant du SDK de bas niveau CANN au framework de haut niveau MindSpore — offre un environnement de développement et de déploiement IA étroitement intégré, optimisé pour le matériel Ascend.
Cette formation en présentiel ou à distance, animée par un formateur, s'adresse aux professionnels techniques de niveau débutant à intermédiaire souhaitant comprendre comment les composants CANN et MindSpore fonctionnent ensemble pour soutenir la gestion du cycle de vie de l'IA et les décisions en matière d'infrastructure.
À l'issue de cette formation, les participants seront capables de :
- Comprendre l'architecture en couches de la pile de calcul IA de Huawei.
- Identifier comment CANN prend en charge l'optimisation des modèles et le déploiement au niveau du matériel.
- Évaluer le framework MindSpore et sa chaîne d'outils par rapport aux alternatives du secteur.
- Situer la pile IA de Huawei dans des environnements d'entreprise ou cloud/sur site.
Format de la formation
- Cours interactif et discussion.
- Démonstrations système en direct et études de cas.
- Labs guidés optionnels sur le flux des modèles de MindSpore vers CANN.
Options de personnalisation de la formation
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour en convenir.
Optimisation des performances des réseaux de neurones avec le SDK CANN
14 HeuresLe SDK CANN (Compute Architecture for Neural Networks) est la base de calcul IA de Huawei, permettant aux développeurs d’affiner et d’optimiser les performances des réseaux de neurones déployés sur des processeurs IA Ascend.
Cette formation en présentiel ou en ligne, animée par un formateur, s’adresse aux développeurs IA et ingénieurs systèmes de niveau avancé souhaitant optimiser les performances d’inférence à l’aide de l’ensemble d’outils avancés de CANN, incluant le moteur de graphes (Graph Engine), TIK et le développement d’opérateurs personnalisés.
À l’issue de cette formation, les participants seront en mesure de :
- Comprendre l’architecture d’exécution de CANN et le cycle de vie des performances.
- Utiliser les outils de profilage et le moteur de graphes pour l’analyse et l’optimisation des performances.
- Créer et optimiser des opérateurs personnalisés à l’aide de TIK et TVM.
- Résoudre les goulots d’étranglement mémoire et améliorer le débit des modèles.
Format de la formation
- Conférence interactive et discussions.
- Travaux pratiques avec profilage en temps réel et réglage des opérateurs.
- Exercices d’optimisation utilisant des exemples de déploiement en conditions limites.
Options de personnalisation de la formation
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour en convenir.
SDK CANN pour les pipelines de vision par ordinateur et de NLP
14 HeuresLe SDK CANN (Compute Architecture for Neural Networks) fournit des outils puissants de déploiement et d'optimisation pour les applications d'IA en temps réel en vision par ordinateur et en NLP (traitement du langage naturel), en particulier sur le matériel Huawei Ascend.
Cette formation en direct animée par un instructeur (en ligne ou sur site) s'adresse aux praticiens de l'IA de niveau intermédiaire souhaitant créer, déployer et optimiser des modèles de vision et de langage à l'aide du SDK CANN pour des cas d'utilisation en production.
À l'issue de cette formation, les participants seront capables de :
- Déployer et optimiser les modèles CV et NLP à l'aide de CANN et d'AscendCL.
- Utiliser les outils CANN pour convertir les modèles et les intégrer dans des pipelines en direct.
- Optimiser les performances d'inférence pour des tâches telles que la détection, la classification et l'analyse des sentiments.
- Construire des pipelines CV/NLP en temps réel pour des scénarios de déploiement en périphérie (edge) ou dans le cloud.
Format de la formation
- Cours interactif et démonstrations.
- Ateliers pratiques avec déploiement de modèles et profilage des performances.
- Conception de pipelines en direct à l'aide de cas d'utilisation CV et NLP réels.
Options de personnalisation de la formation
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin de l'organiser.
Création d'opérateurs IA personnalisés avec CANN TIK et TVM
14 HeuresCANN TIK (Tensor Instruction Kernel) et Apache TVM permettent une optimisation avancée et la personnalisation des opérateurs de modèles IA pour le matériel Huawei Ascend.
Cette formation en direct dispensée par un formateur (en ligne ou sur site) s'adresse aux développeurs système de niveau avancé souhaitant créer, déployer et ajuster des opérateurs personnalisés pour des modèles IA à l'aide du modèle de programmation TIK de CANN et de l'intégration du compilateur TVM.
À l'issue de cette formation, les participants seront en mesure de :
- Écrire et tester des opérateurs IA personnalisés à l'aide du DSL TIK pour les processeurs Ascend.
- Intégrer des opérateurs personnalisés dans le runtime CANN et le graphique d'exécution.
- Utiliser TVM pour l'ordonnancement d'opérateurs, le réglage automatique et l'évaluation des performances.
- Déboguer et optimiser les performances au niveau des instructions pour des motifs de calcul personnalisés.
Format du cours
- Cours interactif et démonstration.
- Codage pratique d'opérateurs à l'aide des pipelines TIK et TVM.
- Test et réglage sur du matériel Ascend ou des simulateurs.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour convenir des modalités.
Migration des applications CUDA vers des architectures GPU chinoises
21 HeuresLes architectures GPU chinoises telles que Huawei Ascend, Biren et les MLUs Cambricon offrent des alternatives à CUDA, spécifiquement adaptées aux marchés locaux de l'IA et du HPC.
Cette formation pratique, animée par un formateur (en ligne ou en présentiel), s'adresse aux programmeurs GPU avancés et aux spécialistes de l'infrastructure souhaitant migrer et optimiser leurs applications CUDA existantes pour un déploiement sur des plateformes matérielles chinoises.
À l'issue de cette formation, les participants seront capables de :
- Évaluer la compatibilité des charges de travail CUDA existantes avec les solutions matérielles chinoises.
- Porter les codebases CUDA vers les environnements Huawei CANN, Biren SDK et Cambricon BANGPy.
- Comparer les performances et identifier les points d'optimisation entre les différentes plateformes.
- Traiter les défis pratiques liés au support multi-architecture et au déploiement.
Format de la formation
- Conférence interactive et échanges.
- Ateliers pratiques de traduction de code et de comparaison des performances.
- Exercices guidés axés sur les stratégies d'adaptation multi-GPU.
Options de personnalisation de la formation
- Pour demander une formation personnalisée pour ce cours, adaptée à votre plateforme ou projet CUDA, veuillez nous contacter afin de convenir des détails.
Optimisation des performances sur les plates-formes Ascend, Biren et Cambricon
21 HeuresAscend, Biren et Cambricon sont des plates-formes matérielles d'intelligence artificielle de premier plan en Chine, chacune offrant des outils d'accélération et de profilage spécifiques pour des charges de travail d'IA à l'échelle de la production.
Cette formation en présentiel ou en ligne, animée par un instructeur, s'adresse aux ingénieurs avancés en infrastructure et en performance de l'IA souhaitant optimiser les workflows d'inférence et d'entraînement de modèles sur plusieurs plates-formes de puces d'IA chinoises.
À l'issue de cette formation, les participants seront en mesure de :
- Réaliser des benchmarks de modèles sur les plates-formes Ascend, Biren et Cambricon.
- Identifier les goulots d'étranglement système et les inefficacités mémoire/calcul.
- Appliquer des optimisations au niveau du graphe, du noyau (kernel) et de l'opérateur.
- Ajuster les pipelines de déploiement pour améliorer le débit et réduire la latence.
Format de la formation
- Cours interactif et discussions.
- Prise en main des outils de profilage et d'optimisation sur chaque plate-forme.
- Exercices guidés axés sur des scénarios de réglage pratiques.
Options de personnalisation de la formation
- Pour demander une formation personnalisée pour ce cours en fonction de votre environnement de performance ou du type de modèle, veuillez nous contacter afin d'en convenir.