Cursusaanbod

Inleiding tot Reinforcement Learning en Agentele AI

  • Besluitvorming onder onzekerheid en sequentiële planning
  • Belangrijkste componenten van RL: agenten, omgevingen, toestanden en beloningen
  • Rol van RL in adapteerbare en agentele AI-systemen

Markov Decision Processes (MDPs)

  • Formele definitie en eigenschappen van MDPs
  • Waardefuncties, Bellman-vergelijkingen en dynamische programmering
  • Beleidsevaluatie, -verbetering en -iteratie

Model-Free Reinforcement Learning

  • Monte Carlo- en Temporal-Difference (TD)-leren
  • Q-learning en SARSA
  • Praktijkopdracht: tabulaire RL-methoden implementeren in Python

Deep Reinforcement Learning

  • Combinatie van neurale netwerken en RL voor functiebenadering
  • Deep Q-Networks (DQN) en ervaringsoverdracht
  • Actor-Critic-architecturen en beleidsgradiënten
  • Praktijkopdracht: een agent trainen met DQN en PPO met Stable-Baselines3

Exploratiestrategieën en beloningvorming

  • Balanceren van exploratie vs. exploitatie (ε-greedig, UCB, entropiemethoden)
  • Beloningsfuncties ontwerpen en ongewenst gedrag voorkomen
  • Beloningvorming en curriculumleer

Geavanceerde onderwerpen in RL en besluitvorming

  • Multi-agent reinforcement learning en coöperatieve strategieën
  • Hiërarchische reinforcement learning en optieskader
  • Offline RL en imitatieleer voor veilige implementatie

Simuleringsomgevingen en evaluatie

  • OpenAI Gym gebruiken en aangepaste omgevingen
  • Continue vs. discreet actieruimte
  • Metrieken voor agentprestaties, stabiliteit en steekproefefficiëntie

RL integreren in agentele AI-systemen

  • Redenering en RL combineren in hybride agentarchitecturen
  • Reinforcement learning combineren met toolgebruikende agenten
  • Operatieve overwegingen voor schaling en implementatie

Afstudieproject

  • Een reinforcement learning-agent ontwerpen en implementeren voor een gesimuleerde opdracht
  • Trainingsevaluatie doorvoeren en hyperparameters optimaliseren
  • Adaptief gedrag en besluitvorming in een agentele context demonstreren

Samenvatting en volgende stappen

Vereisten

  • Sterke beheersing van Python-programmeren
  • Solide begrip van machine learning en deep learning-concepten
  • Vertrouwdheid met lineaire algebra, waarschijnlijkheidsrekening en basisoptimalisatiemethodes

Doelgroep

  • Reinforcement learning-ingenieurs en toegepaste AI-onderzoekers
  • Robotica- en automatisatieontwikkelaars
  • Ingenieurs teams die werken aan adapteerbare en agentele AI-systemen
 28 uren

Aantal deelnemers


Prijs per deelnemer

Getuigenissen (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën