Prenez contact avec nous

Plan du cours

Aperçu de l'écosystème des GPU IA chinois

  • Comparaison entre Huawei Ascend, Biren et Cambricon MLU
  • Modèles CUDA vs CANN, Biren SDK et BANGPy
  • Tendances de l'industrie et écosystèmes des fournisseurs

Préparation à la migration

  • Évaluation de votre codebase CUDA
  • Identification des plateformes cibles et des versions SDK
  • Installation de la chaîne d'outils et configuration de l'environnement

Techniques de traduction de code

  • Portage de l'accès mémoire CUDA et de la logique des noyaux
  • Mappage des modèles de grilles de calcul et de threads
  • Solutions de traduction automatisées vs manuelles

Implémentations spécifiques à la plateforme

  • Utilisation des opérateurs Huawei CANN et des noyaux personnalisés
  • Pipeline de conversion Biren SDK
  • Reconstruction des modèles avec BANGPy (Cambricon)

Tests multi-plateformes et optimisation

  • Profiling de l'exécution sur chaque plateforme cible
  • Tuning de la mémoire et comparaisons d'exécution parallèle
  • Suivi des performances et itérations

Gestion des environnements GPU mixtes

  • Déploiements hybrides avec plusieurs architectures
  • Stratégies de repli et détection des périphériques
  • Couches d'abstraction pour la maintenabilité du code

Études de cas et bonnes pratiques

  • Portage des modèles de vision/NLP vers Ascend ou Cambricon
  • Adaptation des pipelines d'inférence sur les clusters Biren
  • Gestion des incompatibilités de versions et des écarts d'API

Synthèse et prochaines étapes

Pré requis

  • Expérience en programmation CUDA ou avec des applications basées sur le GPU
  • Compréhension des modèles de mémoire GPU et des noyaux de calcul
  • Connaissance des workflows de déploiement ou d'accélération des modèles d'IA

Audience visée

  • Programmeurs GPU
  • Architectes systèmes
  • Spécialistes du portage
 21 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires