Prenez contact avec nous

Plan du cours

Introduction à la Génération Augmentée par Récupération (RAG)

  • Qu'est-ce que le RAG et pourquoi c'est important pour l'IA en entreprise
  • Composants d'un système RAG : récupérateur, générateur, magasin de documents
  • Comparaison avec les LLMs autonomes et la recherche vectorielle

Mise en place d'un pipeline RAG

  • Installation et configuration de Haystack ou de frameworks similaires
  • Ingestion et prétraitement des documents
  • Connexion des récupérateurs aux bases de données vectorielles (par ex., FAISS, Pinecone)

Ajustement fin du Récupérateur

  • Entraînement des récupérateurs denses avec des données spécifiques au domaine
  • Utilisation des transformeurs de phrases et de l'apprentissage contrastif
  • Évaluation de la qualité du récupérateur avec la précision top-k

Ajustement fin du Générateur

  • Sélection des modèles de base (par ex., BART, T5, FLAN-T5)
  • Ajustement par instruction versus ajustement fin supervisé
  • Méthodes LoRA et PEFT pour des mises à jour efficaces

Évaluation et optimisation

  • Métriques d'évaluation des performances du RAG (par ex., BLEU, EM, F1)
  • Latence, qualité de la récupération et réduction des hallucinations
  • Suivi des expériences et amélioration itérative

Déploiement et intégration en monde réel

  • Déploiement du RAG dans les moteurs de recherche internes et les chatbots
  • Considérations en matière de sécurité, d'accès aux données et de gouvernance
  • Intégration avec des API, des tableaux de bord ou des portails de connaissances

Études de cas et bonnes pratiques

  • Cas d'usage en entreprise dans la finance, la santé et le juridique
  • Gestion de la dérive du domaine et des mises à jour de la base de connaissances
  • Perspectives futures pour les systèmes LLM à récupération augmentée

résumé et prochaines étapes

Pré requis

  • Une compréhension des concepts du Traitement Automatique du Langage Naturel (TAL)
  • Une expérience avec les modèles de langage basés sur les transformeurs
  • Une familiarité avec Python et les flux de travail de base en apprentissage automatique

Public cible

  • Ingénieurs en TAL
  • Équipes de gestion des connaissances
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires