Prenez contact avec nous

Plan du cours

Introduction à l'ajustement fin du modèle DeepSeek LLM

  • Aperçu des modèles DeepSeek, par exemple DeepSeek-R1 et DeepSeek-V3.
  • Compréhension de la nécessité d'ajuster finement les LLM.
  • Comparaison entre l'ajustement fin et l'ingénierie des prompts.

Préparation de l'ensemble de données pour l'ajustement fin

  • Sélection d'ensembles de données spécifiques à un domaine.
  • Techniques de prétraitement et de nettoyage des données.
  • Tokenisation et mise en forme des ensembles de données pour le DeepSeek LLM.

Configuration de l'environnement d'ajustement fin

  • Configuration de l'accélération GPU et TPU.
  • Mise en place de Hugging Face Transformers avec le DeepSeek LLM.
  • Compréhension des hyperparamètres pour l'ajustement fin.

Ajustement fin du modèle DeepSeek LLM

  • Mise en œuvre de l'ajustement fin supervisé.
  • Utilisation de LoRA (Low-Rank Adaptation) et de PEFT (Parameter-Efficient Fine-Tuning).
  • Exécution d'un ajustement fin distribué pour des ensembles de données à grande échelle.

Évaluation et optimisation des modèles ajustés finement

  • Évaluation des performances du modèle à l'aide de métriques d'évaluation.
  • Gestion du surapprentissage (overfitting) et du sous-apprentissage (underfitting).
  • Optimisation de la vitesse d'inférence et de l'efficacité du modèle.

Déploiement des modèles DeepSeek ajustés finement

  • Conditionnement des modèles pour le déploiement via API.
  • Intégration des modèles ajustés finement dans les applications.
  • Mise à l'échelle des déploiements avec le cloud et l'informatique en périphérie (edge computing).

Études de cas et applications réelles

  • LLM ajustés finement pour la finance, la santé et le service client.
  • Études de cas d'applications industrielles.
  • Considérations éthiques dans les modèles d'IA spécifiques à un domaine.

Résumé et prochaines étapes

Pré requis

  • Expérience avec les frameworks d'apprentissage automatique et d'apprentissage profond.
  • Familiarité avec les modèles de type Transformeur (Transformers) et les grands modèles de langage (LLM).
  • Compréhension des techniques de prétraitement des données et d'entraînement des modèles.

Public cible

  • Chercheurs en IA explorant l'ajustement fin des LLM.
  • Ingénieurs en apprentissage automatique développant des modèles d'IA personnalisés.
  • Développeurs avancés implémentant des solutions pilotées par l'IA.
 21 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires