Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
Introductie
- Leren door positieve bekrachtiging
Elements van Reinforcement Learning
Belangrijke termen (acties, staten, beloningen, beleid, waarde, q-waarde, enz.)
Overzicht van methoden voor tabeloplossingen
Een softwareagent maken
Inzicht in op waarden gebaseerde, op beleid gebaseerde en modelgebaseerde benaderingen
Werken met het Markov Decision Process (MDP)
Hoe beleid de manier van handelen van een agent bepaalt
Monte Carlo-methoden gebruiken
Leren in de tijd
n-stap Bootstrapping
Geschatte oplossingsmethoden
Voorspelling op het beleid met benadering
Controle op het beleid met benadering
Off-policy Methoden met benadering
Inzicht in geschiktheidstraceringen
Methoden voor beleidsverloop gebruiken
Samenvatting en conclusie
Vereisten
- Ervaring met machine learning
- Programming Ervaring
Audiëntie
- Datawetenschappers
21 Uren