Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à l'ajustement fin du modèle DeepSeek LLM
- Aperçu des modèles DeepSeek, par exemple DeepSeek-R1 et DeepSeek-V3.
- Compréhension de la nécessité d'ajuster finement les LLM.
- Comparaison entre l'ajustement fin et l'ingénierie des prompts.
Préparation de l'ensemble de données pour l'ajustement fin
- Sélection d'ensembles de données spécifiques à un domaine.
- Techniques de prétraitement et de nettoyage des données.
- Tokenisation et mise en forme des ensembles de données pour le DeepSeek LLM.
Configuration de l'environnement d'ajustement fin
- Configuration de l'accélération GPU et TPU.
- Mise en place de Hugging Face Transformers avec le DeepSeek LLM.
- Compréhension des hyperparamètres pour l'ajustement fin.
Ajustement fin du modèle DeepSeek LLM
- Mise en œuvre de l'ajustement fin supervisé.
- Utilisation de LoRA (Low-Rank Adaptation) et de PEFT (Parameter-Efficient Fine-Tuning).
- Exécution d'un ajustement fin distribué pour des ensembles de données à grande échelle.
Évaluation et optimisation des modèles ajustés finement
- Évaluation des performances du modèle à l'aide de métriques d'évaluation.
- Gestion du surapprentissage (overfitting) et du sous-apprentissage (underfitting).
- Optimisation de la vitesse d'inférence et de l'efficacité du modèle.
Déploiement des modèles DeepSeek ajustés finement
- Conditionnement des modèles pour le déploiement via API.
- Intégration des modèles ajustés finement dans les applications.
- Mise à l'échelle des déploiements avec le cloud et l'informatique en périphérie (edge computing).
Études de cas et applications réelles
- LLM ajustés finement pour la finance, la santé et le service client.
- Études de cas d'applications industrielles.
- Considérations éthiques dans les modèles d'IA spécifiques à un domaine.
Résumé et prochaines étapes
Pré requis
- Expérience avec les frameworks d'apprentissage automatique et d'apprentissage profond.
- Familiarité avec les modèles de type Transformeur (Transformers) et les grands modèles de langage (LLM).
- Compréhension des techniques de prétraitement des données et d'entraînement des modèles.
Public cible
- Chercheurs en IA explorant l'ajustement fin des LLM.
- Ingénieurs en apprentissage automatique développant des modèles d'IA personnalisés.
- Développeurs avancés implémentant des solutions pilotées par l'IA.
21 Heures