Prenez contact avec nous

Plan du cours

Aperçu des capacités d’optimisation de CANN

  • Gestion des performances d’inférence dans CANN
  • Objectifs d’optimisation pour les systèmes IA embarqués et intégrés
  • Compréhension de l’utilisation des cœurs IA et de l’allocation mémoire

Utilisation du moteur de graphes (Graph Engine) pour l’analyse

  • Introduction au moteur de graphes et au pipeline d’exécution
  • Visualisation des graphes d’opérateurs et des métriques d’exécution
  • Modification des graphes de calcul pour l’optimisation

Outils de profilage et métriques de performances

  • Utilisation de l’outil de profilage CANN (profiler) pour l’analyse des charges de travail
  • Analyse du temps d’exécution des noyaux et des goulots d’étranglement
  • Profilage de l’accès mémoire et stratégies de tuilage (tiling)

Développement d’opérateurs personnalisés avec TIK

  • Aperçu de TIK et du modèle de programmation des opérateurs
  • Mise en œuvre d’un opérateur personnalisé avec TIK DSL
  • Tests et évaluation des performances des opérateurs

Optimisation avancée des opérateurs avec TVM

  • Présentation de l’intégration de TVM avec CANN
  • Stratégies de réglage automatique des graphes de calcul
  • Quand et comment basculer entre TVM et TIK

Techniques d’optimisation mémoire

  • Gestion de la disposition mémoire et de l’emplacement des tampons
  • Techniques de réduction de la consommation mémoire interne à la puce
  • Bonnes pratiques pour l’exécution asynchrone et la réutilisation

Déploiement en environnement réel et études de cas

  • Étude de cas : réglage des performances pour le pipeline de caméra de ville intelligente
  • Étude de cas : optimisation de la pile d’inférence pour véhicules autonomes
  • Lignes directrices pour le profilage itératif et l’amélioration continue

Résumé et prochaines étapes

Pré requis

  • Bonne compréhension des architectures de modèles d’apprentissage profond et des flux de travail d’entraînement
  • Expérience du déploiement de modèles avec CANN, TensorFlow ou PyTorch
  • Maîtrise de la CLI Linux, des scripts shell et de la programmation Python

Audience cible

  • Ingénieurs en performances IA
  • Spécialistes en optimisation de l’inférence
  • Développeurs travaillant sur l’IA embarquée ou les systèmes temps réel
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires