Prenez contact avec nous

Plan du cours

Introduction à l'apprentissage par renforcement

  • Qu'est-ce que l'apprentissage par renforcement ?
  • Concepts clés : agent, environnement, états, actions et récompenses
  • Défis de l'apprentissage par renforcement

Exploration et exploitation

  • Équilibrer exploration et exploitation dans les modèles de RL
  • Stratégies d'exploration : epsilon-greedy, softmax, et plus encore

Apprentissage par renforcement Q (Q-Learning) et réseaux de Q profonds (DQN)

  • Introduction à l'apprentissage par renforcement Q (Q-learning)
  • Implémentation des DQN à l'aide de TensorFlow
  • Optimisation de l'apprentissage par renforcement Q (Q-learning) avec la replay d'expérience et les réseaux cibles

Méthodes basées sur la politique

  • Algorithmes de gradient de politique
  • Algorithme REINFORCE et son implémentation
  • Méthodes acteur-critique

Travail avec OpenAI Gym

  • Configuration des environnements dans OpenAI Gym
  • Simulation d'agents dans des environnements dynamiques
  • Évaluation de la performance des agents

Techniques avancées d'apprentissage par renforcement

  • Apprentissage par renforcement multi-agents
  • Gradient de politique déterministe profonde (DDPG)
  • Optimisation de la politique proximale (PPO)

Déploiement de modèles d'apprentissage par renforcement

  • Applications en monde réel de l'apprentissage par renforcement
  • Intégration des modèles de RL dans des environnements de production

Résumé et prochaines étapes

Pré requis

  • Expérience avec la programmation en Python
  • Compréhension de base des concepts de l'apprentissage profond et de l'apprentissage automatique
  • Connaissance des algorithmes et des concepts mathématiques utilisés dans l'apprentissage par renforcement

Audience

  • Data scientists
  • Praticiens en apprentissage automatique
  • Chercheurs en IA
 28 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires