Schița de curs

Introducere

Reinforcement Learning Elemente de bază

Tehnici de bază Reinforcement Learning.

Introducere în BURLAP

Convergența valorii și iterația politicilor

Modelarea recompensei

Explorare

Generalizare

MDP parțial observabile

Opțiuni

Logistică

TD Lambda

Gradienți politici

Deep Q-Learning

Subiecte în teoria jocurilor

Rezumat și pașii următori

Cerințe

  • Cunoștințe în Python
  • O înțelegere a calculului universitar și a algebrei liniare
  • Înțelegere de bază a probabilității și Statistics
  • .
  • Experiență în crearea de modele de învățare automată în Python și Numpy
  • .

Audiență

  • Dezvoltatorii
  • Cercetători de date
  21 ore
 

Numărul de participanți


Dată început

Dată sfârșit


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Cursuri înrudite

Categorii înrudite