Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
Overzicht van optimalisatiecapaciteiten van CANN
- Hoe inferentieprestaties in CANN worden beheerd
- Optimalisatiedoelen voor AI-systeem op de rand en embedded AI
- Het begrijpen van AI Core-utilisatie en geheugenallocatie
Gebruik van Graph Engine voor analyse
- Inleiding tot de Graph Engine en uitvoeringspijplijn
- Visualiseren van operatorgrafieken en runtime-metriken
- Aanpassen van berekeningsgrafieken voor optimalisatie
Profiling Tools en prestatiemetriken
- Gebruik van het CANN Profiling Tool (profiler) voor workloadanalyse
- Analyseren van kerneluitvoeringstijd en knelpunten
- Geheugenprofileren en tegelsstrategieën
Ontwikkeling van aangepaste operators met TIK
- Overzicht van TIK en operatorprogrammeringsmodel
- Implementeren van een aangepaste operator met behulp van TIK DSL
- Testen en benchmarken van operatorprestaties
Geavanceerde operatoroptimalisatie met TVM
- Introductie tot TVM-integratie met CANN
- Autotuning-strategieën voor berekeningsgrafieken
- Wanneer en hoe te schakelen tussen TVM en TIK
Geheugenoptimalisatietechnieken
- Beheren van geheugenindeling en bufferplaatsing
- Technieken om het op-chip geheugenverbruik te verminderen
- Beste praktijken voor asynchrone uitvoering en hergebruik
Praktische implementatie en case studies
- Case study: prestatieoptimalisatie voor slimme stadscamera-pijplijn
- Case study: optimalisatie van de inferentiestap van autonome voertuigen
- Richtlijnen voor iteratief profileren en continue verbetering
Samenvatting en volgende stappen
Vereisten
- Begrip van diepte van de deep learning model architecturen en training workflows
- Ervaring met modeldeployments met behulp van CANN, TensorFlow, of PyTorch
- Kennis van Linux CLI, shell scripting, en Python programmeren
Publiek
- AI performance engineers
- Specialisten in inference optimalisatie
- Ontwikkelaars die werken met edge AI of real-time systemen
14 Uren