Plan du cours

Introduction

Reinforcement Learning Bases

Techniques de base Reinforcement Learning

Introduction à la toile de jute

Convergence des valeurs et itération des politiques

Façonnage des récompenses

Exploration

Généralisation

MDP partiellement observables

Possibilités

Logistique

TD Lambda

Dégradés politiques

Apprentissage Q profond

Sujets en théorie des jeux

Résumé et prochaines étapes

Pré requis

  • Maîtrise de Python
  • Une compréhension du calcul universitaire et de l'algèbre linéaire
  • Compréhension de base des probabilités et Statistics
  • Expérience de la création de modèles d'apprentissage automatique en Python et Numpy

Audience

  • Développeurs
  • Data Scientists
 21 heures

Nombre de participants



Prix par participant

Cours Similaires

Catégories Similaires