Cursusaanbod

Introductie

  • Leren door positieve bekrachtiging

Elements van Reinforcement Learning

Belangrijke termen (acties, staten, beloningen, beleid, waarde, q-waarde, enz.)

Overzicht van methoden voor tabeloplossingen

Een softwareagent maken

Inzicht in op waarden gebaseerde, op beleid gebaseerde en modelgebaseerde benaderingen

Werken met het Markov Decision Process (MDP)

Hoe beleid de manier van handelen van een agent bepaalt

Monte Carlo-methoden gebruiken

Leren in de tijd

n-stap Bootstrapping

Geschatte oplossingsmethoden

Voorspelling op het beleid met benadering

Controle op het beleid met benadering

Off-policy Methoden met benadering

Inzicht in geschiktheidstraceringen

Methoden voor beleidsverloop gebruiken

Samenvatting en conclusie

Vereisten

  • Ervaring met machine learning
  • Programming Ervaring

Audiëntie

  • Datawetenschappers
 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Voorlopige Aankomende Cursussen

Gerelateerde categorieën