Les cours de formation GPU (unité de traitement graphique) en direct, en ligne ou sur site, animés par un instructeur, démontrent, par le biais de discussions interactives et de pratiques pratiques, les principes fondamentaux du GPU et la manière de programmer les GPU. La formation GPU est disponible en tant que "formation en direct en ligne" ou "formation en direct sur site". La formation en direct en ligne (alias « formation en direct à distance ») est effectuée au moyen d'un ordinateur de bureau interactif à distance . La formation en direct sur site peut être effectuée localement dans les locaux du client en Louvain ou dans les centres de formation d'entreprise NobleProg en Louvain. NobleProg - Votre fournisseur de formation local
Louvain
Park Inn by Radisson Leuven, Martelarenlaan 36, Louvain, Belgique, 3010
Louvain
Louvain (en néerlandais Leuven, en allemand Löwen) est une ville néerlandophone de Belgique située en Région flamande, chef-lieu de la province du Brabant flamand et chef-lieu de l'arrondissement qui porte son nom. Elle est arrosée par la Dyle, affluent du Rupel. C'est une ville universitaire où siège la Katholieke Universiteit Leuven, branche néerlandophone née de la scission de la plus ancienne université de Belgique. Louvain est aussi connue pour abriter le siège de l'entreprise AB InBev, la plus grande brasserie du monde. Louvain est la capitale de la bière en Belgique.
Cette formation en Louvain (en ligne ou sur site) est destinée aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenACC pour programmer des dispositifs hétérogènes et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant le SDK OpenACC, un périphérique supportant OpenACC et du Visual Studio code.
Créer un programme OpenACC de base qui effectue une addition vectorielle sur l'appareil et récupère les résultats de la mémoire de l'appareil.
Utilisez les directives et clauses OpenACC pour annoter le code et spécifier les régions parallèles, le mouvement des données et les options d'optimisation.
Utiliser l'API OpenACC pour demander des informations sur les périphériques, définir leur numéro, gérer les erreurs et synchroniser les événements.
Utiliser les bibliothèques OpenACC et les fonctions d'interopérabilité pour intégrer OpenACC à d'autres modèles de programmation, tels que CUDA, OpenMP et MPI.
Utiliser les outils OpenACC pour profiler et déboguer les programmes OpenACC et identifier les goulets d'étranglement et les opportunités en matière de performances.
Optimiser les programmes OpenACC en utilisant des techniques telles que la localité des données, la fusion des boucles, la fusion des noyaux et l'auto-tuning.
Cette formation en direct avec instructeur en Louvain (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent apprendre les bases de la programmation GPU et les principaux cadres et outils pour le développement d'applications GPU.
A l'issue de cette formation, les participants seront capables de : Comprendre la différence entre le CPU et l'informatique GPU ainsi que les avantages et les défis de la programmation GPU.
Choisir le cadre et l'outil appropriés pour leur application GPU.
Créer un programme GPU de base qui effectue une addition vectorielle en utilisant un ou plusieurs cadres et outils.
Utiliser les API, langages et bibliothèques respectifs pour demander des informations sur le périphérique, allouer et désallouer la mémoire du périphérique, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser les espaces mémoire respectifs, tels que global, local, constant et privé, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution respectifs, tels que les éléments de travail, les groupes de travail, les threads, les blocs et les grilles, pour contrôler le parallélisme.
Déboguer et tester les programmes GPU à l'aide d'outils tels que CodeXL, CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes GPU à l'aide de techniques telles que le coalescing, la mise en cache, le prefetching et le profilage.
Cette formation en direct avec instructeur en Louvain (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser différents frameworks pour la programmation GPU et comparer leurs caractéristiques, leurs performances et leur compatibilité.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant OpenCL SDK, CUDA Toolkit, ROCm Platform, un appareil prenant en charge OpenCL, CUDA ou ROCm, et Visual Studio Code.
Créer un programme GPU de base qui effectue une addition vectorielle en utilisant OpenCL, CUDA et ROCm, et comparer la syntaxe, la structure et l'exécution de chaque cadre.
Utiliser les API respectives pour demander des informations sur les périphériques, allouer et désallouer la mémoire des périphériques, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser les langages respectifs pour écrire des noyaux qui s'exécutent sur l'appareil et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques respectives pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire respectifs, tels que global, local, constant et privé, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution respectifs pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes GPU à l'aide d'outils tels que CodeXL, CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes GPU à l'aide de techniques telles que le coalescing, la mise en cache, le prefetching et le profilage.
CloudMatrix est la plateforme unifiée de développement et déploiement IA de Huawei conçue pour prendre en charge des pipelines d'inférence évolutifs et de production.
Cette formation en direct (en ligne ou sur site) animée par un instructeur s'adresse aux professionnels de l'IA débutants à intermédiaires qui souhaitent déployer et surveiller des modèles IA en utilisant la plateforme CloudMatrix avec une intégration CANN et MindSpore.
À la fin de cette formation, les participants seront capables de :
Utiliser CloudMatrix pour l'emballage, le déploiement et le service des modèles.
Convertir et optimiser des modèles pour les puces Ascend.
Mettre en place des pipelines pour des tâches d'inférence en temps réel et par lots.
Surveiller les déploiements et ajuster les performances dans un environnement de production.
Format du cours
Cours interactif et discussion.
Utilisation pratique de CloudMatrix avec des scénarios de déploiement réels.
Exercices guidés axés sur la conversion, l'optimisation et l'échelle.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours basée sur votre infrastructure IA ou environnement cloud, veuillez nous contacter pour en faire la demande.
Cette formation en Louvain (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent installer et utiliser ROCm sur Windows pour programmer les AMD GPUs et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant la plate-forme ROCm, un code AMD GPU et Visual Studio sur Windows.
Créer un programme ROCm de base qui effectue une addition vectorielle sur le GPU et récupère les résultats de la mémoire GPU.
Utiliser l'API ROCm pour demander des informations sur le périphérique, allouer et désallouer la mémoire du périphérique, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser le langage HIP pour écrire des noyaux qui s'exécutent sur la mémoire GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques HIP pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire ROCm et HIP, tels que les espaces globaux, partagés, constants et locaux, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution ROCm et HIP pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes ROCm et HIP à l'aide d'outils tels que ROCm Debugger et ROCm Profiler.
Optimiser les programmes ROCm et HIP en utilisant des techniques telles que le coalescing, le caching, le prefetching et le profiling.
Cette formation en Louvain (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser ROCm et HIP pour programmer les AMD GPUs et exploiter leur parallélisme.
A la fin de cette formation, les participants seront capables de :
Mettre en place un environnement de développement comprenant la plate-forme ROCm, un code AMD GPU et Visual Studio.
Créer un programme ROCm de base qui effectue une addition vectorielle sur le GPU et récupère les résultats de la mémoire GPU.
Utiliser l'API ROCm pour demander des informations sur le périphérique, allouer et désallouer la mémoire du périphérique, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser le langage HIP pour écrire des noyaux qui s'exécutent sur la mémoire GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques HIP pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire ROCm et HIP, tels que les espaces globaux, partagés, constants et locaux, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser les modèles d'exécution ROCm et HIP pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes ROCm et HIP à l'aide d'outils tels que ROCm Debugger et ROCm Profiler.
Optimiser les programmes ROCm et HIP en utilisant des techniques telles que le coalescing, le caching, le prefetching et le profiling.
Ascend, Biren, and Cambricon are leading AI hardware platforms in China, each offering unique acceleration and profiling tools for production-scale AI workloads.
This instructor-led, live training (online or onsite) is aimed at advanced-level AI infrastructure and performance engineers who wish to optimize model inference and training workflows across multiple Chinese AI chip platforms.
By the end of this training, participants will be able to:
Benchmark models on Ascend, Biren, and Cambricon platforms.
Identify system bottlenecks and memory/compute inefficiencies.
Apply graph-level, kernel-level, and operator-level optimizations.
Tune deployment pipelines to improve throughput and latency.
Format of the Course
Interactive lecture and discussion.
Hands-on use of profiling and optimization tools on each platform.
Guided exercises focused on practical tuning scenarios.
Course Customization Options
To request a customized training for this course based on your performance environment or model type, please contact us to arrange.
Chinese GPU architectures such as Huawei Ascend, Biren, and Cambricon MLUs offer CUDA alternatives tailored for local AI and HPC markets.
This instructor-led, live training (online or onsite) is aimed at advanced-level GPU programmers and infrastructure specialists who wish to migrate and optimize existing CUDA applications for deployment on Chinese hardware platforms.
By the end of this training, participants will be able to:
Evaluate compatibility of existing CUDA workloads with Chinese chip alternatives.
Port CUDA codebases to Huawei CANN, Biren SDK, and Cambricon BANGPy environments.
Compare performance and identify optimization points across platforms.
Address practical challenges in cross-architecture support and deployment.
Format of the Course
Interactive lecture and discussion.
Hands-on code translation and performance comparison labs.
Guided exercises focused on multi-GPU adaptation strategies.
Course Customization Options
To request a customized training for this course based on your platform or CUDA project, please contact us to arrange.
Cette formation en direct avec instructeur en Louvain (en ligne ou sur site) s'adresse aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser CUDA pour programmer les NVIDIA GPU et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Configurer un environnement de développement comprenant CUDA Toolkit, un NVIDIA GPU et un code Visual Studio.
Créer un programme CUDA de base qui effectue une addition vectorielle sur le GPU et récupère les résultats dans la mémoire du GPU.
Utiliser l'API CUDA pour demander des informations sur les périphériques, allouer et désallouer la mémoire des périphériques, copier des données entre l'hôte et le périphérique, lancer des noyaux et synchroniser des threads.
Utiliser le langage CUDA C/C++ pour écrire des noyaux qui s'exécutent sur la mémoire GPU et manipulent des données.
Utiliser les fonctions intégrées, les variables et les bibliothèques CUDA pour effectuer des tâches et des opérations courantes.
Utiliser les espaces mémoire CUDA, tels que les espaces globaux, partagés, constants et locaux, pour optimiser les transferts de données et les accès à la mémoire.
Utiliser le modèle d'exécution CUDA pour contrôler les threads, les blocs et les grilles qui définissent le parallélisme.
Déboguer et tester les programmes CUDA à l'aide d'outils tels que CUDA-GDB, CUDA-MEMCHECK et NVIDIA Nsight.
Optimiser les programmes CUDA à l'aide de techniques telles que le coalescing, la mise en cache, le prefetching et le profilage.
Huawei Ascend est une famille de processeurs IA conçus pour l'inférence et la formation à haute performance.
Cette formation en direct (en ligne ou sur site) animée par un formateur s'adresse aux ingénieurs AI intermédiaires et aux scientifiques des données qui souhaitent développer et optimiser des modèles de réseau neuronal en utilisant la plateforme Ascend de Huawei et l'outil CANN.
À la fin de cette formation, les participants seront capables de :
Configurer l'environnement de développement CANN.
Développer des applications IA à l'aide de MindSpore et des workflows CloudMatrix.
Optimiser les performances sur les NPUs Ascend en utilisant des opérateurs personnalisés et le tiling.
Déployer des modèles dans des environnements edge ou cloud.
Format de la formation
Cours interactif et discussion.
Utilisation pratique de Huawei Ascend et de l'outil CANN dans des applications d'exemple.
Exercices guidés axés sur la construction, la formation et le déploiement du modèle.
Options de personnalisation de la formation
Pour demander une formation personnalisée basée sur votre infrastructure ou vos jeux de données, veuillez nous contacter pour organiser cela.
Les accélérateurs Biren AI sont des GPU de haute performance conçus pour les charges de travail en IA et HPC, avec un support pour l'entraînement et l'inférence à grande échelle.
Cette formation en direct (en ligne ou sur site) animée par un formateur est destinée aux développeurs intermédiaires à avancés qui souhaitent programmer et optimiser des applications en utilisant la pile GPU propriétaire de Biren, avec des comparaisons pratiques avec les environnements basés sur CUDA.
À la fin de cette formation, les participants seront capables de :
Comprendre l'architecture et la hiérarchie mémoire Biren GPU.
Mettre en place l'environnement de développement et utiliser le modèle de programmation Biren.
Traduire et optimiser des codes au style CUDA pour les plateformes Biren.
Appliquer des techniques d'ajustement de performance et de débogage.
Format du cours
Cours interactif et discussion.
Utilisation pratique de la SDK Biren dans des charges de travail GPU d'exemple.
Exercices guidés axés sur le portage et l'ajustement de performance.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours basée sur votre pile d'applications ou vos besoins d'intégration, veuillez nous contacter pour en faire la demande.
Les Cambricon MLUs (Machine Learning Unités) sont des puces AI spécialisées optimisées pour l'inférence et la formation dans les scénarios de périphérie et de centre de données.
Cette formation en direct (en ligne ou sur site), animée par un formateur, s'adresse aux développeurs intermédiaires souhaitant construire et déployer des modèles AI à l'aide du cadre BANGPy et du SDK Neuware sur le matériel Cambricon MLU.
À la fin de cette formation, les participants seront capables de :
Configurer et configurer les environnements de développement BANGPy et Neuware.
Développer et optimiser des modèles basés sur Python et C++ pour Cambricon MLUs.
Déployer des modèles vers des appareils de périphérie et de centre de données exécutant le runtime Neuware.
Intégrer les flux de travail ML avec des fonctionnalités d'accélération spécifiques à MLU.
Format du cours
Cours interactifs et discussions.
Utilisation pratique de BANGPy et Neuware pour le développement et le déploiement.
Exercices guidés axés sur l'optimisation, l'intégration et les tests.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours basée sur votre modèle d'appareil Cambricon ou votre cas d'utilisation, veuillez nous contacter pour organiser cela.
Introduction à Cambricon et à l'architecture MLU
Aperçu de la gamme de puces AI de Cambricon
Architecture MLU et pipeline d'instructions
Types de modèles pris en charge et cas d'utilisation
Installation du chaînon de développement
Installation de BANGPy et du SDK Neuware
Configuration de l'environnement pour Python et C++
Compatibilité des modèles et prétraitement
Développement de modèles avec BANGPy
Gestion de la structure et de la forme du tenseur
Construction du graphe de calcul
Soutien aux opérations personnalisées dans BANGPy
Déploiement avec le runtime Neuware
Conversion et chargement des modèles
Contrôle d'exécution et d'inférence
Pratiques de déploiement pour périphérie et centre de données
Optimisation des performances
Mappage mémoire et réglage par couche
Suivi d'exécution et profilage
Bouchons courants et corrections
Intégration de MLU dans les applications
Utilisation des API Neuware pour l'intégration d'applications
Soutien au streaming et aux modèles multiples
Scénarios d'inférence hybride CPU-MLU
Projet de bout en bout et Use Case
Laboratoire : déploiement d'un modèle vision ou NLP
Inférence périphérique avec intégration BANGPy
Test de précision et de débit
Récapitulatif et prochaines étapes
Compréhension des structures de modèles d'apprentissage automatique
Expérience avec Python et/ou C++
Familiarité avec les concepts de déploiement et d'accélération des modèles
Audience
Développeurs AI embarqués
Ingénieurs ML déployant sur périphérie ou centre de données
Développeurs travaillant avec l'infrastructure AI chinoise
Cette formation en direct avec instructeur à Louvain (en ligne ou sur site) s'adresse aux administrateurs système débutants et aux professionnels de l'informatique qui souhaitent installer, configurer, gérer et dépanner les environnements CUDA.
A l'issue de cette formation, les participants seront capables de :
Comprendre l'architecture, les composants et les capacités de CUDA.
Installer et configurer les environnements CUDA.
Gérer et optimiser les ressources CUDA.
Déboguer et résoudre les problèmes CUDA les plus courants.
Cette formation en direct dans Louvain (en ligne ou sur site) est destinée aux développeurs de niveau débutant à intermédiaire qui souhaitent utiliser OpenCL pour programmer des dispositifs hétérogènes et exploiter leur parallélisme.
A l'issue de cette formation, les participants seront capables de :
Mettre en place un environnement de développement comprenant le SDK OpenCL, un appareil supportant le OpenCL et le code Visual Studio.
Créer un programme OpenCL de base qui effectue une addition vectorielle sur l'appareil et récupère les résultats de la mémoire de l'appareil.
Utiliser l'API OpenCL pour demander des informations sur le périphérique, créer des contextes, des files d'attente de commandes, des tampons, des noyaux et des événements.
Utiliser le langage C OpenCL pour écrire des noyaux qui s'exécutent sur le périphérique et manipulent des données.
Utiliser les fonctions intégrées, les extensions et les bibliothèques OpenCL pour effectuer des tâches et des opérations courantes.
Utiliser les modèles de mémoire de l'hôte et de l'appareil pour optimiser les transferts de données et les accès à la mémoire.
Utiliser le modèle d'exécution OpenCL pour contrôler les éléments de travail, les groupes de travail et les plages ND.
Déboguer et tester les programmes OpenCL à l'aide d'outils tels que CodeXL, Intel VTune et NVIDIA Nsight.
Optimiser les programmes OpenCL en utilisant des techniques telles que la vectorisation, le déroulement des boucles, la mémoire locale et le profilage.
Cette formation dispensée par un instructeur en direct à Louvain (en ligne ou sur site) s'adresse aux développeurs de niveau intermédiaire qui souhaitent utiliser CUDA pour créer des applications Python qui s'exécutent en parallèle sur les NVIDIA GPU.
A l'issue de cette formation, les participants seront capables de :
Utiliser le compilateur Numba pour accélérer les applications Python s'exécutant sur les GPU NVIDIA GPU.
Créer, compiler et lancer des kernels CUDA personnalisés.
Gérer la mémoire des GPU GPU.
Convertir une application basée sur le CPU en une application accélérée par les GPU GPU.
Cette formation en direct, dirigée par un instructeur, couvre la programmation de GPUs pour le calcul parallèle, l'utilisation de diverses plateformes, le travail avec la plateforme CUDA et ses fonctionnalités, et l'exécution de diverses techniques d'optimisation à l'aide de CUDA. Les applications comprennent l'apprentissage profond, l'analyse, le traitement d'images et les applications d'ingénierie.
En savoir plus...
Dernière Mise À Jour:
Nos clients témoignent (2)
Très interactif avec des exemples variés, avec une bonne progression de la complexité entre le début et la fin de la formation.
Jenny - Andheo
Formation - GPU Programming with CUDA and Python
Traduction automatique
L'énergie et l'humour des formateurs.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Graphics Processing Unit (GPU) formation à Louvain, Weekend GPU (Graphics Processing Unit) cours à Louvain, Soir GPU (Graphics Processing Unit) formation à Louvain, Graphics Processing Unit formateur en ligne à Louvain, GPU (Graphics Processing Unit) formation à Louvain, Graphics Processing Unit cours du soir à Louvain, Graphics Processing Unit (GPU) formation Intra à Louvain, GPU formation Intra Entreprise à Louvain, Graphics Processing Unit formation Inter à Louvain, Graphics Processing Unit (GPU) formation Inter Entreprise à Louvain, GPU (Graphics Processing Unit) formateur à Louvain, GPU (Graphics Processing Unit) entraînement à Louvain, GPU stage de préparation à Louvain, GPU (Graphics Processing Unit) préparation à Louvain, GPU (Graphics Processing Unit) coaching à Louvain, GPU cours privé à Louvain, Graphics Processing Unit cours particuliers à Louvain, GPU instructeur à Louvain, Weekend Graphics Processing Unit (GPU) formation à Louvain, Soir Graphics Processing Unit cours à Louvain, GPU (Graphics Processing Unit) professeur à Louvain,Graphics Processing Unit (GPU) cours à Louvain, Graphics Processing Unit sur place à Louvain, GPU préparation aux examens à Louvain, Graphics Processing Unit (GPU) coach à Louvain