Prenez contact avec nous

Plan du cours

Introduction à l'apprentissage par renforcement

  • Aperçu de l'apprentissage par renforcement et de ses applications
  • Différences entre l'apprentissage supervisé, non supervisé et par renforcement
  • Concepts clés : agent, environnement, récompenses et politique

Processus décisionnels de Markov (MDP)

  • Comprendre les états, actions, récompenses et transitions d'état
  • Fonctions de valeur et équation de Bellman
  • Programmation dynamique pour résoudre les MDP

Algorithmes RL fondamentaux

  • Méthodes tabulaires : Q-Learning et SARSA
  • Méthodes basées sur la politique : algorithme REINFORCE
  • Architectures Actor-Critic et leurs applications

Apprentissage par renforcement profond

  • Introduction aux réseaux de Q-values profonds (DQN)
  • Réplay d'expériences et réseaux cibles
  • Gradients de politique et méthodes avancées d'apprentissage profond par renforcement

Frameworks et outils RL

  • Introduction à OpenAI Gym et d'autres environnements RL
  • Utilisation de PyTorch ou TensorFlow pour le développement de modèles RL
  • Entraînement, test et évaluation des agents RL

Défis en apprentissage par renforcement

  • Équilibrer l'exploration et l'exploitation lors de l'entraînement
  • Gérer les récompenses rares et les problèmes d'attribution du crédit
  • Passibilité et défis computationnels en RL

Activités pratiques

  • Implémentation des algorithmes Q-Learning et SARSA à partir de zéro
  • Entraîner un agent basé sur DQN à jouer à un jeu simple dans OpenAI Gym
  • Ajustement fin des modèles RL pour améliorer les performances dans des environnements personnalisés

Résumé et prochaines étapes

Pré requis

  • Bonne compréhension des principes et algorithmes d'apprentissage automatique
  • Maîtrise du langage de programmation Python
  • Familiarité avec les réseaux de neurones et les frameworks d'apprentissage profond

Public cible

  • Ingénieurs en apprentissage automatique
  • Spécialistes en IA
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires