Cursusaanbod
1. Inleiding tot Deep Reinforcement Learning
- Wat is Reinforcement Learning?
- Het verschil tussen Supervised, Unsupervised, en Reinforcement Learning
- Toepassingen van DRL in 2025 (robotica, gezondheidszorg, financiën, logistiek)
- Het begrijpen van de agent-milieu interactie-lus
2. Fundamentals van Reinforcement Learning
- Markov Decision Processes (MDP)
- Staat, actie, beloning, beleid, en waardefuncties
- De afweging tussen exploratie en exploitatie
- Monte Carlo methoden en Temporal-Difference (TD) learning
3. Basale RL-algoritmes implementeren
- Tabulaire methoden: Dynamic Programming, beleidsbeoordeling, en iteratie
- Q-Learning en SARSA
- Epsilon-greedy exploratie en afnemende strategieën
- RL-omgevingen implementeren met OpenAI Gymnasium
4. Overgang naar Deep Reinforcement Learning
- Beperkingen van tabulaire methoden
- Het gebruiken van neurale netwerken voor functie-approximatie
- Deep Q-Network (DQN) architectuur en workflow
- Ervaringsherhaling en doelnetwerken
5. Geavanceerde DRL-algoritmes
- Double DQN, Dueling DQN, en Prioritized Experience Replay
- Beleid-gradient methoden: REINFORCE algoritme
- Actor-Critic architecturen (A2C, A3C)
- Proximal Policy Optimization (PPO)
- Soft Actor-Critic (SAC)
6. Werken met continue actie-ruimtes
- Uitdagingen in continue controle
- Het gebruiken van DDPG (Deep Deterministic Policy Gradient)
- Twin Delayed DDPG (TD3)
7. Praktische tools en frameworks
- Het gebruiken van Stable-Baselines3 en Ray RLlib
- Loggen en monitoren met TensorBoard
- Hyperparameter tuning voor DRL-modellen
8. Beloning Engineering en milieu-ontwerp
- Beloning vormgeven en straf balanceren
- Sim-to-real transfer learning concepten
- Aangepaste omgevingen maken in Gymnasium
9. Deelbaar waargenomen omgevingen en generalisatie
- Onvoldoende staat informatie verwerken (POMDPs)
- Geheugengebaseerde benaderingen met behulp van LSTMs en RNNs
- De robuustheid van agenten en generalisatie verbeteren
10. Game Theory en Multi-Agent Reinforcement Learning
- Inleiding tot multi-agent omgevingen
- Samenwerking vs. competitie
- Toepassingen in tegenovergestelde training en strategie optimalisatie
11. Casusstudies en praktische toepassingen
- Simulaties van autonome voertuigen
- Dynamische prijsstelling en financiële handelsstrategieën
- Robotica en industriële automatisering
12. Probleemoplossing en optimalisatie
- Instabiel trainen diagnosticeren
- Beloning schaarste en overfitting beheren
- DRL-modellen schalen op GPUs en gedistribueerde systemen
13. Samenvatting en volgende stappen
- Samenvatting van DRL-architectuur en sleutelalgoritmen
- Industrie-trends en onderzoek richtingen (bijv. RLHF, hybride modellen)
- Verdere bronnen en leesmateriaal
Vereisten
- Vaardigheid in Python-programmeren
- Begrip van Calculus en Lineaire Algebra
- Basiswetenschap van Kansrekening en Statistiek
- Ervaring in het bouwen van machine learning-modellen met Python en NumPy of TensorFlow/PyTorch
Publiek
- Ontwikkelaars geïnteresseerd in AI en intelligente systemen
- Datawetenschappers die versterkingsleer-frameworks verkennen
- Machine Learning Engineers die werken met autonome systemen
Getuigenissen (5)
Hunter is fantastisch, zeer boeiend, uiterst deskundig en knap. Heel goed gedaan.
Rick Johnson - Laramie County Community College
Cursus - Artificial Intelligence (AI) Overview
Automatisch vertaald
Very flexible.
Frank Ueltzhoffer
Cursus - Artificial Neural Networks, Machine Learning and Deep Thinking
Automatisch vertaald
I liked the new insights in deep machine learning.
Josip Arneric
Cursus - Neural Network in R
Automatisch vertaald
Ann created a great environment to ask questions and learn. We had a lot of fun and also learned a lot at the same time.
Gudrun Bickelq
Cursus - Introduction to the use of neural networks
Automatisch vertaald
It was very interactive and more relaxed and informal than expected. We covered lots of topics in the time and the trainer was always receptive to talking more in detail or more generally about the topics and how they were related. I feel the training has given me the tools to continue learning as opposed to it being a one off session where learning stops once you've finished which is very important given the scale and complexity of the topic.
Jonathan Blease
Cursus - Artificial Neural Networks, Machine Learning, Deep Thinking
Automatisch vertaald