Prenez contact avec nous

Plan du cours

Introduction

Comprendre les fondamentaux de la méthodologie du calcul hétérogène

Pourquoi le calcul parallèle ? Comprendre la nécessité du calcul parallèle

Processeurs multi-cœurs - Architecture et conception

Introduction aux threads, bases des threads et concepts fondamentaux de la programmation parallèle

Comprendre les fondamentaux des processus d'optimisation logicielle GPU

OpenMP - Une norme pour la programmation parallèle basée sur des directives

Pratique / Démonstration de divers programmes sur des machines multicœurs

Introduction au calcul GPU

GPU pour le calcul parallèle

Modèle de programmation GPU

Pratique / Démonstration de divers programmes sur GPU

SDK, Toolkit et installation de l'environnement pour GPU

Travail avec diverses bibliothèques

Démonstration de GPU et outils avec des exemples de programmes et OpenACC

Comprendre le modèle de programmation CUDA

Apprendre l'architecture CUDA

Exploration et configuration des environnements de développement CUDA

Travail avec l'API runtime CUDA

Comprendre le modèle de mémoire CUDA

Exploration des fonctionnalités supplémentaires de l'API CUDA

Accès efficace à la mémoire globale dans CUDA : optimisation de la mémoire globale

Optimisation des transferts de données dans CUDA à l'aide de flux CUDA

Utilisation de la mémoire partagée dans CUDA

Compréhension et utilisation des opérations atomiques et instructions dans CUDA

Étude de cas : traitement d'images numériques basique avec CUDA

Travail avec la programmation multi-GPU

Profilage matériel avancé et échantillonnage sur NVIDIA / CUDA

Utilisation de l'API de parallélisme dynamique CUDA pour le lancement dynamique de kernels

Résumé et conclusion

Pré requis

  • Programmation C
  • Linux GCC
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires