Cursusaanbod

Inleiding tot Versterkingsleer

  • Overzicht van versterkingsleer en haar toepassingen
  • Verschillen tussen begeleid, onbegeleid en versterkingsleer
  • Belangrijke concepten: agent, omgeving, beloningen en beleid

Markov Decision Processes (MDPs)

  • Begrip van staten, acties, beloningen en toestandsoverschakelingen
  • Waardefuncties en de Bellman-vergelijking
  • Dynamisch programmeren voor het oplossen van MDPs

Kern RL Algorithmen

  • Tabellarische methoden: Q-Learning en SARSA
  • Beleidsgebaseerde methoden: REINFORCE algoritme
  • Actor-Critic kader en hun toepassingen

Deep Reinforcement Learning

  • Inleiding tot Deep Q-Networks (DQN)
  • Ervaringsherhaling en doelnetwerken
  • Beleidgradiënten en geavanceerde diepe RL-methoden

RL Frameworks en Tools

  • Inleiding tot OpenAI Gym en andere RL-omgevingen
  • Gebruik van PyTorch of TensorFlow voor RL-modelontwikkeling
  • Trainen, testen en benchmarken van RL-agenten

Uitdagingen in RL

  • Balanceren van exploratie en exploitatie tijdens het trainen
  • Omgaan met schaarse beloningen en credittoewijzingsproblemen
  • Schaalbaarheid en rekenkrachtige uitdagingen in RL

Praktijkactiviteiten

  • Implementeren van Q-Learning en SARSA algoritmen vanaf de grond
  • Trainen van een DQN-gebaseerde agent om een eenvoudig spel te spelen in OpenAI Gym
  • Fijnafstellen van RL-modellen voor verbeterde prestaties in aangepaste omgevingen

Samenvatting en volgende stappen

Vereisten

  • Sterke kennis van machine learning principes en algoritmen
  • Vaardigheid in Python-programmeren
  • Kennis van neurale netwerken en deep learning frameworks

Publiek

  • Machine learning engineers
  • AI-specialisten
 14 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (1)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën