Cursusaanbod
Inleiding tot Reinforcement Learning en Agentele AI
- Besluitvorming onder onzekerheid en sequentiële planning
- Belangrijkste componenten van RL: agenten, omgevingen, toestanden en beloningen
- Rol van RL in adapteerbare en agentele AI-systemen
Markov Decision Processes (MDPs)
- Formele definitie en eigenschappen van MDPs
- Waardefuncties, Bellman-vergelijkingen en dynamische programmering
- Beleidsevaluatie, -verbetering en -iteratie
Model-Free Reinforcement Learning
- Monte Carlo- en Temporal-Difference (TD)-leren
- Q-learning en SARSA
- Praktijkopdracht: tabulaire RL-methoden implementeren in Python
Deep Reinforcement Learning
- Combinatie van neurale netwerken en RL voor functiebenadering
- Deep Q-Networks (DQN) en ervaringsoverdracht
- Actor-Critic-architecturen en beleidsgradiënten
- Praktijkopdracht: een agent trainen met DQN en PPO met Stable-Baselines3
Exploratiestrategieën en beloningvorming
- Balanceren van exploratie vs. exploitatie (ε-greedig, UCB, entropiemethoden)
- Beloningsfuncties ontwerpen en ongewenst gedrag voorkomen
- Beloningvorming en curriculumleer
Geavanceerde onderwerpen in RL en besluitvorming
- Multi-agent reinforcement learning en coöperatieve strategieën
- Hiërarchische reinforcement learning en optieskader
- Offline RL en imitatieleer voor veilige implementatie
Simuleringsomgevingen en evaluatie
- OpenAI Gym gebruiken en aangepaste omgevingen
- Continue vs. discreet actieruimte
- Metrieken voor agentprestaties, stabiliteit en steekproefefficiëntie
RL integreren in agentele AI-systemen
- Redenering en RL combineren in hybride agentarchitecturen
- Reinforcement learning combineren met toolgebruikende agenten
- Operatieve overwegingen voor schaling en implementatie
Afstudieproject
- Een reinforcement learning-agent ontwerpen en implementeren voor een gesimuleerde opdracht
- Trainingsevaluatie doorvoeren en hyperparameters optimaliseren
- Adaptief gedrag en besluitvorming in een agentele context demonstreren
Samenvatting en volgende stappen
Vereisten
- Sterke beheersing van Python-programmeren
- Solide begrip van machine learning en deep learning-concepten
- Vertrouwdheid met lineaire algebra, waarschijnlijkheidsrekening en basisoptimalisatiemethodes
Doelgroep
- Reinforcement learning-ingenieurs en toegepaste AI-onderzoekers
- Robotica- en automatisatieontwikkelaars
- Ingenieurs teams die werken aan adapteerbare en agentele AI-systemen
Getuigenissen (3)
Goede mix van kennis en praktijk
Ion Mironescu - Facultatea S.A.I.A.P.M.
Cursus - Agentic AI for Enterprise Applications
Automatisch vertaald
De combinatie van theorie en praktijk, en van hoge- en lagenniveau perspectieven
Ion Mironescu - Facultatea S.A.I.A.P.M.
Cursus - Autonomous Decision-Making with Agentic AI
Automatisch vertaald
praktische oefeningen
Daniel - Facultatea S.A.I.A.P.M.
Cursus - Agentic AI in Multi-Agent Systems
Automatisch vertaald