Cursusaanbod

1. Inleiding tot Deep Reinforcement Learning

  • Wat is Reinforcement Learning?
  • Het verschil tussen Supervised, Unsupervised, en Reinforcement Learning
  • Toepassingen van DRL in 2025 (robotica, gezondheidszorg, financiën, logistiek)
  • Het begrijpen van de agent-milieu interactie-lus

2. Fundamentals van Reinforcement Learning

  • Markov Decision Processes (MDP)
  • Staat, actie, beloning, beleid, en waardefuncties
  • De afweging tussen exploratie en exploitatie
  • Monte Carlo methoden en Temporal-Difference (TD) learning

3. Basale RL-algoritmes implementeren

  • Tabulaire methoden: Dynamic Programming, beleidsbeoordeling, en iteratie
  • Q-Learning en SARSA
  • Epsilon-greedy exploratie en afnemende strategieën
  • RL-omgevingen implementeren met OpenAI Gymnasium

4. Overgang naar Deep Reinforcement Learning

  • Beperkingen van tabulaire methoden
  • Het gebruiken van neurale netwerken voor functie-approximatie
  • Deep Q-Network (DQN) architectuur en workflow
  • Ervaringsherhaling en doelnetwerken

5. Geavanceerde DRL-algoritmes

  • Double DQN, Dueling DQN, en Prioritized Experience Replay
  • Beleid-gradient methoden: REINFORCE algoritme
  • Actor-Critic architecturen (A2C, A3C)
  • Proximal Policy Optimization (PPO)
  • Soft Actor-Critic (SAC)

6. Werken met continue actie-ruimtes

  • Uitdagingen in continue controle
  • Het gebruiken van DDPG (Deep Deterministic Policy Gradient)
  • Twin Delayed DDPG (TD3)

7. Praktische tools en frameworks

  • Het gebruiken van Stable-Baselines3 en Ray RLlib
  • Loggen en monitoren met TensorBoard
  • Hyperparameter tuning voor DRL-modellen

8. Beloning Engineering en milieu-ontwerp

  • Beloning vormgeven en straf balanceren
  • Sim-to-real transfer learning concepten
  • Aangepaste omgevingen maken in Gymnasium

9. Deelbaar waargenomen omgevingen en generalisatie

  • Onvoldoende staat informatie verwerken (POMDPs)
  • Geheugengebaseerde benaderingen met behulp van LSTMs en RNNs
  • De robuustheid van agenten en generalisatie verbeteren

10. Game Theory en Multi-Agent Reinforcement Learning

  • Inleiding tot multi-agent omgevingen
  • Samenwerking vs. competitie
  • Toepassingen in tegenovergestelde training en strategie optimalisatie

11. Casusstudies en praktische toepassingen

  • Simulaties van autonome voertuigen
  • Dynamische prijsstelling en financiële handelsstrategieën
  • Robotica en industriële automatisering

12. Probleemoplossing en optimalisatie

  • Instabiel trainen diagnosticeren
  • Beloning schaarste en overfitting beheren
  • DRL-modellen schalen op GPUs en gedistribueerde systemen

13. Samenvatting en volgende stappen

  • Samenvatting van DRL-architectuur en sleutelalgoritmen
  • Industrie-trends en onderzoek richtingen (bijv. RLHF, hybride modellen)
  • Verdere bronnen en leesmateriaal

Vereisten

  • Vaardigheid in Python-programmeren
  • Begrip van Calculus en Lineaire Algebra
  • Basiswetenschap van Kansrekening en Statistiek
  • Ervaring in het bouwen van machine learning-modellen met Python en NumPy of TensorFlow/PyTorch

Publiek

  • Ontwikkelaars geïnteresseerd in AI en intelligente systemen
  • Datawetenschappers die versterkingsleer-frameworks verkennen
  • Machine Learning Engineers die werken met autonome systemen
 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën