Prenez contact avec nous

Plan du cours

Introduction à l'architecture GPU Biren

  • Présentation de Biren et cas d'utilisation
  • Structure matérielle : cœurs, mémoire, clusters de calcul
  • Comparaison avec les GPU NVIDIA et AMD

Configuration de l'environnement de programmation Biren

  • Installation du SDK et du runtime Biren
  • Compréhension de la chaîne d'outils et du modèle de compilateur
  • Structure de projet de base et processus de construction

Programmation GPU avec la pile Biren

  • Modèles de threads et de blocs
  • Gestion de la mémoire et transferts de données
  • Développement de noyaux et motifs de lancement

Portage de CUDA vers Biren

  • Techniques de traduction du code CUDA
  • Mappages et adaptations d'API courants
  • Labs de conversion de code et pratique

Débogage et profilage

  • Utilisation du débogueur et du profileur de Biren
  • Identification des goulots d'étranglement
  • Patterns d'accès à la mémoire et optimisation

Techniques d'optimisation

  • Ordonnancement des threads et pipeline d'instructions
  • Déroulement de boucles et utilisation de la mémoire partagée
  • Réglage avancé des noyaux pour le débit

Étude de cas et exemples d'application

  • Entraînement d'un modèle avec les accélérateurs Biren
  • Portage et profilage d'un modèle de vision ou de NLP
  • Comparaison des performances par rapport à CUDA/NVIDIA

Résumé et prochaines étapes

Pré requis

  • Une compréhension de l'architecture GPU et du traitement parallèle.
  • Expérience avec CUDA, OpenCL ou des environnements de programmation GPU similaires.
  • Familiarité avec les frameworks d'apprentissage profond tels que PyTorch ou TensorFlow.

Public cible

  • Développeurs HPC
  • Ingénieurs en infrastructure IA
  • Spécialistes de l'optimisation des performances
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires