Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Introductie
- Leren door positieve bekrachtiging
Elements van Reinforcement Learning
Belangrijke termen (acties, staten, beloningen, beleid, waarde, Q-waarde, enz.)
Overzicht van methoden voor oplossingen in tabelvorm
Een softwareagent maken
Inzicht in op waarden gebaseerde, op beleid gebaseerde en modelgebaseerde benaderingen
Werken met het Markov Decision Process (MDP)
Hoe beleid de manier van handelen van een agent bepaalt
Monte Carlo-methoden gebruiken
Temporeel-Verschil Leren
n-stap Bootstrapping
Benaderingsmethoden voor oplossingen
Voorspelling op het beleid met benadering
Controle op het beleid met benadering
Off-policy Methoden met Approximatie
Inzicht in geschiktheidstraceringen
Methoden voor beleidsverloop gebruiken
Samenvatting en conclusie
Requirements
- Ervaring met machinaal leren
- Programming ervaring
Publiek
- Datawetenschappers
21 Hours