Formation Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts est un cours pratique sur le déploiement fiable à grande échelle des modèles Tencent Hunyuan.

Cette formation en présentiel (en ligne ou sur site), animée par un formateur, s'adresse aux ingénieurs et architectes de niveau intermédiaire souhaitant utiliser Tencent Hunyuan pour déployer des modèles volumineux et MoE (Mixture of Experts) avec une latence réduite, une meilleure utilisation des GPU et des coûts d'exploitation maîtrisés.

À l'issue de cette formation, les participants seront capables de :

expliquer les principaux défis de production liés au déploiement des modèles Tencent Hunyuan.
mettre en œuvre des techniques d'optimisation de l'inférence telles que TensorRT, le réglage du cache KV, la quantification et le regroupement par lots.
concevoir une approche de déploiement évolutive incluant le scaling automatique, la surveillance et la planification des capacités.
améliorer l'arbitrage entre latence et coût pour des charges de travail en production réelle.

Format du cours

Cours interactif et discussion.
De nombreux exercices et mises en pratique.
Implémentation pratique dans un environnement de laboratoire en direct.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Cours à venir

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

2026-08-21 09:30

14 heures

Liège, Place des Guillemins

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

2026-09-04 09:30

14 heures

Namur, Hotel de Ville

2550 EUR (En ligne)

2950 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

2026-09-18 09:30

14 heures

Bruxelles

2550 EUR (En ligne)

3650 EUR (Salle de Classe)

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

2026-10-02 09:30

14 heures

Bruges

2550 EUR (En ligne)

3350 EUR (Salle de Classe)

Formation Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Plan du cours

Pré requis

Cours à venir

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Plan du cours

Pré requis

Cours à venir

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Déploiement de Tencent Hunyuan en Production : Inférence à Faible Latence et Optimisation des Coûts

Cours Similaires

LangGraph Avancé : Optimisation, Débogage et Surveillance de Graphes Complexe

Création d'agents de codage avec Devstral : de la conception d'agents aux outils

Open-Source Model Ops : Auto-hébergement, affinement et gouvernance avec les modèles Devstral et Mistral

Applications de LangGraph dans le secteur financier

Fondamentaux de LangGraph : Saisonnage d’invocations et enchaînement de LLM basés sur les graphes

LangGraph dans la santé : orchestration de flux de travail pour les environnements réglementés

LangGraph pour les applications juridiques

Construire des flux de travail dynamiques avec LangGraph et des agents LLM

LangGraph pour l'automatisation du marketing

Le Chat Enterprise : ChatOps privé, intégrations et contrôles administratifs

Architectures de LLM économiques : Mistral à grande échelle (Ingénierie des performances et des coûts)

Industrialisation des assistants conversationnels avec Mistral Connectors & Integrations

Déploiements de niveau entreprise avec Mistral Medium 3

Mistral pour une IA responsable : confidentialité, résidence des données et contrôles d’entreprise

Applications multimodales avec les modèles Mistral (Vision, OCR et compréhension de documents)

Catégories Similaires

Large Language Models (LLMs)

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites