Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Aperçu des capacités d’optimisation de CANN
- Gestion des performances d’inférence dans CANN
- Objectifs d’optimisation pour les systèmes IA embarqués et intégrés
- Compréhension de l’utilisation des cœurs IA et de l’allocation mémoire
Utilisation du moteur de graphes (Graph Engine) pour l’analyse
- Introduction au moteur de graphes et au pipeline d’exécution
- Visualisation des graphes d’opérateurs et des métriques d’exécution
- Modification des graphes de calcul pour l’optimisation
Outils de profilage et métriques de performances
- Utilisation de l’outil de profilage CANN (profiler) pour l’analyse des charges de travail
- Analyse du temps d’exécution des noyaux et des goulots d’étranglement
- Profilage de l’accès mémoire et stratégies de tuilage (tiling)
Développement d’opérateurs personnalisés avec TIK
- Aperçu de TIK et du modèle de programmation des opérateurs
- Mise en œuvre d’un opérateur personnalisé avec TIK DSL
- Tests et évaluation des performances des opérateurs
Optimisation avancée des opérateurs avec TVM
- Présentation de l’intégration de TVM avec CANN
- Stratégies de réglage automatique des graphes de calcul
- Quand et comment basculer entre TVM et TIK
Techniques d’optimisation mémoire
- Gestion de la disposition mémoire et de l’emplacement des tampons
- Techniques de réduction de la consommation mémoire interne à la puce
- Bonnes pratiques pour l’exécution asynchrone et la réutilisation
Déploiement en environnement réel et études de cas
- Étude de cas : réglage des performances pour le pipeline de caméra de ville intelligente
- Étude de cas : optimisation de la pile d’inférence pour véhicules autonomes
- Lignes directrices pour le profilage itératif et l’amélioration continue
Résumé et prochaines étapes
Pré requis
- Bonne compréhension des architectures de modèles d’apprentissage profond et des flux de travail d’entraînement
- Expérience du déploiement de modèles avec CANN, TensorFlow ou PyTorch
- Maîtrise de la CLI Linux, des scripts shell et de la programmation Python
Audience cible
- Ingénieurs en performances IA
- Spécialistes en optimisation de l’inférence
- Développeurs travaillant sur l’IA embarquée ou les systèmes temps réel
14 Heures