Cursusaanbod

Introductie tot versterkende leren

  • Wat is versterkende leren?
  • Sleutelconcepten: agent, omgeving, toestanden, acties en beloningen
  • Uitdagingen bij versterkende leren

Ontdekking en Exploitatie

  • Balanceren van ontdekking en exploitatie in RL-modellen
  • Ontdekkingsstrategieën: epsilon-greedy, softmax en meer

Q-Learning en Deep Q-Networks (DQNs)

  • Introductie tot Q-learning
  • Implementeren van DQNs met behulp van TensorFlow
  • Optimaliseren van Q-learning met ervaringsherhaling en doelnetwerken

Policy-Based Methoden

  • Policy-gradientalgoritmen
  • REINFORCE-algoritme en zijn implementatie
  • Actor-critic-methoden

Werken met OpenAI Gym

  • Omgevingen instellen in OpenAI Gym
  • Agenten simuleren in dynamische omgevingen
  • Evaluatie van agentprestaties

Geavanceerde Reinforcement Learning Technieken

  • Meerdere agent versterkende leren
  • Deep deterministische policy gradient (DDPG)
  • Proximal policy optimalisatie (PPO)

Implementeren van Reinforcement Learning Modellen

  • Pratique toepassingen van versterkende leren
  • Integraal maken van RL-modellen in productieomgevingen

Samenvatting en volgende stappen

Vereisten

  • Ervaring met Python programmeren
  • Basisbegrip van deep learning- en machine learning-concepten
  • Kennis van algoritmen en wiskundige concepten die worden gebruikt in reinforcement learning

Publiek

  • Datawetenschappers
  • Machine learning-practitioners
  • AI-onderzoekers
 28 Uren

Aantal deelnemers


Prijs Per Deelnemer

Voorlopige Aankomende Cursussen

Gerelateerde categorieën