Accueil
Formation Infographie
Formation GPU
Formation Programmation GPU avec OpenACC

Formation Programmation GPU avec OpenACC

OpenACC est une norme ouverte pour la programmation hétérogène qui permet à un code de s'exécuter sur différentes plateformes et dispositifs, tels que les CPU multicœurs, les GPU, les FPGA et d'autres.

Cette formation en présentiel, animée par un formateur (en ligne ou sur site), s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenACC pour programmer des dispositifs hétérogènes et exploiter leur parallélisme.

À l'issue de cette formation, les participants seront capables de :

Configurer un environnement de développement OpenACC.
Rédiger et exécuter un programme OpenACC de base.
Annoter le code avec des directives et des clauses OpenACC.
Utiliser l'API et les bibliothèques OpenACC.
Profiler, déboguer et optimiser les programmes OpenACC.

Format de la formation

Cours interactif et discussions.
De nombreux exercices et pratiques.
Mise en œuvre pratique dans un environnement de laboratoire en direct.

Options de personnalisation de la formation

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Plan du cours

Introduction

Qu'est-ce que OpenACC ?
OpenACC vs OpenCL vs CUDA vs SYCL
Aperçu des fonctionnalités et de l'architecture d'OpenACC
Configuration de l'environnement de développement

Premiers pas

Création d'un projet OpenACC dans Visual Studio Code
Exploration de la structure du projet et des fichiers
Compilation et exécution du programme
Affichage de la sortie avec printf et fprintf

Directives et clauses OpenACC

Comprendre les directives et les clauses OpenACC
Utilisation des directives parallèles pour créer des régions parallèles
Utilisation des directives kernels pour le parallélisme géré par le compilateur
Utilisation des directives de boucle pour paralléliser les boucles
Gestion des mouvements de données avec les directives de données
Synchronisation des données avec les directives de mise à jour
Amélioration de la réutilisation des données avec les directives de cache
Création de fonctions de dispositif avec les directives de routine
Synchronisation des événements avec les directives d'attente

API OpenACC

Compréhension du rôle de l'API OpenACC
Interrogation des informations et des capacités du dispositif
Définir le numéro et le type de dispositif
Gestion des erreurs et des exceptions
Création et synchronisation des événements

Bibliothèques et interopérabilité OpenACC

Compréhension des bibliothèques OpenACC et de l'interopérabilité
Utilisation des bibliothèques mathématiques, aléatoires et complexes
Intégration avec d'autres modèles (CUDA, OpenMP, MPI)
Intégration avec les bibliothèques GPU (cuBLAS, cuFFT)

Outils OpenACC

Compréhension des outils OpenACC dans le développement
Profiling et débogage des programmes OpenACC
Analyse des performances avec le compilateur PGI, NVIDIA Nsight Systems, Allinea Forge

Optimisation

Facteurs influençant les performances des programmes OpenACC
Optimisation de la localité des données et réduction des transferts
Optimisation du parallélisme des boucles et de la fusion
Optimisation du parallélisme des kernels et de la fusion
Optimisation de la vectorisation et de l'auto-réglage

Résumé et prochaines étapes

Pré requis

Une compréhension des langages C/C++ ou Fortran et des concepts de programmation parallèle
Des connaissances de base en architecture informatique et hiérarchie de mémoire
Une expérience avec les outils en ligne de commande et les éditeurs de code

Audience

Développeurs qui souhaitent apprendre à utiliser OpenACC pour programmer des dispositifs hétérogènes et exploiter leur parallélisme
Développeurs qui souhaitent écrire un code portable et évolutif pouvant s'exécuter sur différentes plateformes et dispositifs
Programmeurs qui souhaitent explorer les aspects de haut niveau de la programmation hétérogène et optimiser la productivité de leur code

28 Heures

Nombre de participants

En ligne

Salle de Classe

Choisir le lieu

Veuillez choisir le lieu souhaité

Prix par participant

Les formations ouvertes requièrent plus de 3 participants.

Formation Programmation GPU avec OpenACC - Réservation

Nom complet *

Email *

Téléphone *

Poste

Nom de l'entreprise

Adresse 1 *

Ville *

État / Province

Pays *

Code postal *

Date de début

Numéro d'identification fiscale

Les dates sont soumises à disponibilité et se déroulent entre 09:30 et 16:30.

Paiement *

Virement bancaire (facture, commande)

Carte de débit / Carte de crédit

Commentaires

Termes et Conditions *

Je suis un représentant autorisé du client et je souhaite réserver la formation / services conformément aux conditions générales et à la politique de confidentialité de NobleProg.

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Formation Programmation GPU avec OpenACC - Demande de renseignements

Nom complet *

Email *

Téléphone *

Nombre de participants

Nom de l'entreprise

Adresse de l'entreprise

Comment souhaitez-vous suivre le cours ?

Locaux Clients

En ligne

Salle de Classe

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Programmation GPU avec OpenACC - Demande d'informations consulting

Nom complet *

Téléphone *

Email *

Nom de l'entreprise

Sujet du Conseil *

But du Consulting

Avec qui le consultant travaillera?

Développement d'applications IA avec Huawei Ascend et CANN

21 Heures

Huawei Ascend est une gamme de processeurs IA conçus pour l'inférence et l'entraînement haute performance.

Cette formation pratique, animée par un formateur (en ligne ou sur site), s'adresse aux ingénieurs IA et aux data scientists de niveau intermédiaire souhaitant développer et optimiser des modèles de réseaux neuronaux à l'aide de la plateforme Huawei Ascend et de la boîte à outils CANN.

À l'issue de cette formation, les participants seront capables de :

Installer et configurer l'environnement de développement CANN.
Développer des applications IA en utilisant les flux de travail MindSpore et CloudMatrix.
Optimiser les performances sur les NPU Ascend à l'aide d'opérateurs personnalisés et du tuilage (tiling).
Déployer des modèles dans des environnements edge ou cloud.

Format du cours

Cours interactif et échanges.
Manipulation pratique des outils Huawei Ascend et CANN sur des applications d'exemple.
Exercices guidés axés sur la construction, l'entraînement et le déploiement de modèles.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, basée sur votre infrastructure ou vos jeux de données, veuillez nous contacter pour organiser cela.

Déploiement de modèles d'IA avec CANN et les processeurs IA Ascend

14 Heures

CANN (Compute Architecture for Neural Networks) est la pile de calcul IA de Huawei, conçue pour déployer et optimiser les modèles d'IA sur les processeurs IA Ascend.

Cette formation en présentiel ou à distance, animée par un formateur, s'adresse aux développeurs et ingénieurs en IA de niveau intermédiaire souhaitant déployer efficacement des modèles d'IA entraînés sur le matériel Huawei Ascend, en utilisant la boîte à outils CANN ainsi que des outils tels que MindSpore, TensorFlow ou PyTorch.

À l'issue de cette formation, les participants seront capables de :

Comprendre l'architecture de CANN et son rôle dans le pipeline de déploiement de l'IA.
Convertir et adapter des modèles issus de frameworks populaires vers des formats compatibles avec Ascend.
Utiliser des outils tels que ATC, la conversion de modèles OM et MindSpore pour l'inférence en périphérie et dans le cloud.
Diagnostiquer les problèmes de déploiement et optimiser les performances sur le matériel Ascend.

Format de la formation

Cours interactif accompagné de démonstrations.
Travaux pratiques avec les outils CANN et des simulateurs ou appareils Ascend.
Scénarios de déploiement concrets basés sur des modèles d'IA réels.

Options de personnalisation de la formation

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin de l'organiser.

Inférence et déploiement avec CloudMatrix

21 Heures

CloudMatrix est la plateforme unifiée de développement et de déploiement d'IA de Huawei, conçue pour prendre en charge des pipelines d'inférence évolutifs et prêts pour la production.

Cette formation en direct animée par un formateur (en ligne ou sur site) s'adresse aux professionnels de l'IA de niveau débutant à intermédiaire souhaitant déployer et surveiller des modèles d'IA à l'aide de la plateforme CloudMatrix, avec une intégration de CANN et MindSpore.

À l'issue de cette formation, les participants seront capables de :

Utiliser CloudMatrix pour l'emballage, le déploiement et la mise à disposition des modèles.
Convertir et optimiser les modèles pour les jeux de puces Ascend.
Configurer des pipelines pour les tâches d'inférence en temps réel et par lots.
Surveiller les déploiements et ajuster les performances dans des environnements de production.

Format du cours

Cours interactif et discussions.
Prise en main de CloudMatrix avec des scénarios de déploiement réels.
Exercices guidés axés sur la conversion, l'optimisation et la mise à l'échelle.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, basée sur votre infrastructure d'IA ou votre environnement cloud, veuillez nous contacter pour organiser cela.

Programmation GPU sur les accélérateurs IA Biren

21 Heures

Les accélérateurs IA Biren sont des GPU hautes performances conçus pour les charges de travail d'IA et HPC, prenant en charge l'entraînement et l'inférence à grande échelle.

Cette formation en direct, animée par un formateur (en ligne ou sur site), s'adresse aux développeurs de niveau intermédiaire à avancé souhaitant programmer et optimiser des applications à l'aide de la pile GPU propriétaire de Biren, avec des comparaisons pratiques par rapport aux environnements basés sur CUDA.

À l'issue de cette formation, les participants seront en mesure de :

Comprendre l'architecture des GPU Biren et leur hiérarchie mémoire.
Configurer l'environnement de développement et utiliser le modèle de programmation de Biren.
Traduire et optimiser le code de style CUDA pour les plateformes Biren.
Appliquer des techniques de réglage des performances et de débogage.

Format du cours

Conférence interactive et discussion.
Utilisation pratique du SDK Biren sur des exemples de charges de travail GPU.
Exercices guidés axés sur le portage et le réglage des performances.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours basée sur votre pile d'applications ou vos besoins d'intégration, veuillez nous contacter pour organiser cela.

Développement avec MLU de Cambricon via BANGPy et Neuware

21 Heures

Les UIM (Unités d'Informatique pour l'IA) de Cambricon sont des puces spécialisées dans le domaine de l'IA, optimisées pour l'inférence et l'entraînement dans des contextes de périphérie (edge) et de centres de données.

Ce training animé par un instructeur (en ligne ou en présentiel) s'adresse aux développeurs de niveau intermédiaire souhaitant construire et déployer des modèles d'IA en utilisant le framework BANGPy et le SDK Neuware sur du matériel Cambricon MLU.

À l'issue de ce training, les participants seront capables de :

Configurer et mettre en place les environnements de développement BANGPy et Neuware.
Développer et optimiser des modèles basés sur Python et/ou C++ pour les UIM Cambricon.
Déployer des modèles sur des périphériques de périphérie et de centres de données fonctionnant avec le runtime Neuware.
Intégrer les workflows ML avec les fonctionnalités d'accélération spécifiques aux UIM.

Format du cours

Conférences interactives et discussions.
Pratique de BANGPy et Neuware pour le développement et le déploiement.
Exercices guidés axés sur l'optimisation, l'intégration et les tests.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours basée sur votre modèle d'appareil Cambricon ou votre cas d'utilisation, veuillez nous contacter pour convenir des détails.

Introduction à CANN pour les développeurs de frameworks IA

7 Heures

CANN (Compute Architecture for Neural Networks) est la boîte à outils de calcul IA de Huawei, utilisée pour compiler, optimiser et déployer des modèles IA sur les processeurs IA Ascend.

Cette formation en présentiel ou en ligne, animée par un instructeur, s'adresse aux développeurs IA débutants souhaitant comprendre comment CANN s'intègre dans le cycle de vie des modèles, de l'entraînement au déploiement, et comment il interagit avec des frameworks tels que MindSpore, TensorFlow et PyTorch.

À l'issue de cette formation, les participants seront en mesure de :

Comprendre l'objectif et l'architecture de la boîte à outils CANN.
Configurer un environnement de développement avec CANN et MindSpore.
Convertir et déployer un modèle IA simple sur du matériel Ascend.
Acquérir des connaissances fondamentales pour de futurs projets d'optimisation ou d'intégration avec CANN.

Format du cours

Cours interactif et discussions.
Travaux pratiques avec déploiement de modèles simples.
Défilement étape par étape de la chaîne d'outils CANN et des points d'intégration.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.

Déploiement de l'IA sur la périphérie avec CANN

14 Heures

La boîte à outils Ascend CANN de Huawei permet d'exécuter des inférences IA puissantes sur des appareils périphériques tels que l'Ascend 310. CANN fournit les outils essentiels pour compiler, optimiser et déployer des modèles dans des environnements où les ressources de calcul et la mémoire sont limitées.

Cette formation en direct, dispensée par un instructeur (en ligne ou sur site), s'adresse aux développeurs et intégrateurs de niveau intermédiaire en IA qui souhaitent déployer et optimiser des modèles sur des appareils périphériques Ascend en utilisant la chaîne d'outils CANN.

À l'issue de cette formation, les participants seront capables :

De préparer et convertir des modèles IA pour l'Ascend 310 en utilisant les outils CANN.
De créer des pipelines d'inférence légers grâce à MindSpore Lite et AscendCL.
D'optimiser les performances des modèles pour des environnements avec des ressources de calcul et de mémoire limitées.
De déployer et surveiller des applications IA dans des cas d'usage périphériques réels.

Format du cours

Conférence interactive et démonstrations.
Travaux pratiques avec des modèles et scénarios spécifiques à la périphérie.
Déploiements en direct sur du matériel périphérique virtuel ou physique.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin d'en convenir.

Comprendre la pile de calcul IA de Huawei : de CANN à MindSpore

14 Heures

La pile IA de Huawei — allant du SDK de bas niveau CANN au framework de haut niveau MindSpore — offre un environnement de développement et de déploiement IA étroitement intégré, optimisé pour le matériel Ascend.

Cette formation en présentiel ou à distance, animée par un formateur, s'adresse aux professionnels techniques de niveau débutant à intermédiaire souhaitant comprendre comment les composants CANN et MindSpore fonctionnent ensemble pour soutenir la gestion du cycle de vie de l'IA et les décisions en matière d'infrastructure.

À l'issue de cette formation, les participants seront capables de :

Comprendre l'architecture en couches de la pile de calcul IA de Huawei.
Identifier comment CANN prend en charge l'optimisation des modèles et le déploiement au niveau du matériel.
Évaluer le framework MindSpore et sa chaîne d'outils par rapport aux alternatives du secteur.
Situer la pile IA de Huawei dans des environnements d'entreprise ou cloud/sur site.

Format de la formation

Cours interactif et discussion.
Démonstrations système en direct et études de cas.
Labs guidés optionnels sur le flux des modèles de MindSpore vers CANN.

Options de personnalisation de la formation

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour en convenir.

Optimisation des performances des réseaux de neurones avec le SDK CANN

14 Heures

Le SDK CANN (Compute Architecture for Neural Networks) est la base de calcul IA de Huawei, permettant aux développeurs d’affiner et d’optimiser les performances des réseaux de neurones déployés sur des processeurs IA Ascend.

Cette formation en présentiel ou en ligne, animée par un formateur, s’adresse aux développeurs IA et ingénieurs systèmes de niveau avancé souhaitant optimiser les performances d’inférence à l’aide de l’ensemble d’outils avancés de CANN, incluant le moteur de graphes (Graph Engine), TIK et le développement d’opérateurs personnalisés.

À l’issue de cette formation, les participants seront en mesure de :

Comprendre l’architecture d’exécution de CANN et le cycle de vie des performances.
Utiliser les outils de profilage et le moteur de graphes pour l’analyse et l’optimisation des performances.
Créer et optimiser des opérateurs personnalisés à l’aide de TIK et TVM.
Résoudre les goulots d’étranglement mémoire et améliorer le débit des modèles.

Format de la formation

Conférence interactive et discussions.
Travaux pratiques avec profilage en temps réel et réglage des opérateurs.
Exercices d’optimisation utilisant des exemples de déploiement en conditions limites.

Options de personnalisation de la formation

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour en convenir.

SDK CANN pour les pipelines de vision par ordinateur et de NLP

14 Heures

Le SDK CANN (Compute Architecture for Neural Networks) fournit des outils puissants de déploiement et d'optimisation pour les applications d'IA en temps réel en vision par ordinateur et en NLP (traitement du langage naturel), en particulier sur le matériel Huawei Ascend.

Cette formation en direct animée par un instructeur (en ligne ou sur site) s'adresse aux praticiens de l'IA de niveau intermédiaire souhaitant créer, déployer et optimiser des modèles de vision et de langage à l'aide du SDK CANN pour des cas d'utilisation en production.

À l'issue de cette formation, les participants seront capables de :

Déployer et optimiser les modèles CV et NLP à l'aide de CANN et d'AscendCL.
Utiliser les outils CANN pour convertir les modèles et les intégrer dans des pipelines en direct.
Optimiser les performances d'inférence pour des tâches telles que la détection, la classification et l'analyse des sentiments.
Construire des pipelines CV/NLP en temps réel pour des scénarios de déploiement en périphérie (edge) ou dans le cloud.

Format de la formation

Cours interactif et démonstrations.
Ateliers pratiques avec déploiement de modèles et profilage des performances.
Conception de pipelines en direct à l'aide de cas d'utilisation CV et NLP réels.

Options de personnalisation de la formation

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin de l'organiser.

Création d'opérateurs IA personnalisés avec CANN TIK et TVM

14 Heures

CANN TIK (Tensor Instruction Kernel) et Apache TVM permettent une optimisation avancée et la personnalisation des opérateurs de modèles IA pour le matériel Huawei Ascend.

Cette formation en direct dispensée par un formateur (en ligne ou sur site) s'adresse aux développeurs système de niveau avancé souhaitant créer, déployer et ajuster des opérateurs personnalisés pour des modèles IA à l'aide du modèle de programmation TIK de CANN et de l'intégration du compilateur TVM.

À l'issue de cette formation, les participants seront en mesure de :

Écrire et tester des opérateurs IA personnalisés à l'aide du DSL TIK pour les processeurs Ascend.
Intégrer des opérateurs personnalisés dans le runtime CANN et le graphique d'exécution.
Utiliser TVM pour l'ordonnancement d'opérateurs, le réglage automatique et l'évaluation des performances.
Déboguer et optimiser les performances au niveau des instructions pour des motifs de calcul personnalisés.

Format du cours

Cours interactif et démonstration.
Codage pratique d'opérateurs à l'aide des pipelines TIK et TVM.
Test et réglage sur du matériel Ascend ou des simulateurs.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour convenir des modalités.

Migration des applications CUDA vers des architectures GPU chinoises

21 Heures

Les architectures GPU chinoises telles que Huawei Ascend, Biren et les MLUs Cambricon offrent des alternatives à CUDA, spécifiquement adaptées aux marchés locaux de l'IA et du HPC.

Cette formation pratique, animée par un formateur (en ligne ou en présentiel), s'adresse aux programmeurs GPU avancés et aux spécialistes de l'infrastructure souhaitant migrer et optimiser leurs applications CUDA existantes pour un déploiement sur des plateformes matérielles chinoises.

À l'issue de cette formation, les participants seront capables de :

Évaluer la compatibilité des charges de travail CUDA existantes avec les solutions matérielles chinoises.
Porter les codebases CUDA vers les environnements Huawei CANN, Biren SDK et Cambricon BANGPy.
Comparer les performances et identifier les points d'optimisation entre les différentes plateformes.
Traiter les défis pratiques liés au support multi-architecture et au déploiement.

Format de la formation

Conférence interactive et échanges.
Ateliers pratiques de traduction de code et de comparaison des performances.
Exercices guidés axés sur les stratégies d'adaptation multi-GPU.

Options de personnalisation de la formation

Pour demander une formation personnalisée pour ce cours, adaptée à votre plateforme ou projet CUDA, veuillez nous contacter afin de convenir des détails.

Optimisation des performances sur les plates-formes Ascend, Biren et Cambricon

21 Heures

Ascend, Biren et Cambricon sont des plates-formes matérielles d'intelligence artificielle de premier plan en Chine, chacune offrant des outils d'accélération et de profilage spécifiques pour des charges de travail d'IA à l'échelle de la production.

Cette formation en présentiel ou en ligne, animée par un instructeur, s'adresse aux ingénieurs avancés en infrastructure et en performance de l'IA souhaitant optimiser les workflows d'inférence et d'entraînement de modèles sur plusieurs plates-formes de puces d'IA chinoises.

À l'issue de cette formation, les participants seront en mesure de :

Réaliser des benchmarks de modèles sur les plates-formes Ascend, Biren et Cambricon.
Identifier les goulots d'étranglement système et les inefficacités mémoire/calcul.
Appliquer des optimisations au niveau du graphe, du noyau (kernel) et de l'opérateur.
Ajuster les pipelines de déploiement pour améliorer le débit et réduire la latence.

Format de la formation

Cours interactif et discussions.
Prise en main des outils de profilage et d'optimisation sur chaque plate-forme.
Exercices guidés axés sur des scénarios de réglage pratiques.

Options de personnalisation de la formation

Pour demander une formation personnalisée pour ce cours en fonction de votre environnement de performance ou du type de modèle, veuillez nous contacter afin d'en convenir.

Catégories Similaires

Formation Programmation GPU avec OpenACC

Plan du cours

Pré requis

Cours à venir

Programmation GPU avec OpenACC

Programmation GPU avec OpenACC

Programmation GPU avec OpenACC

Programmation GPU avec OpenACC

Programmation GPU avec OpenACC

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites