Schița de curs

Introducere

Reinforcement Learning Elemente de bază

Tehnici de bază Reinforcement Learning.

Introducere în BURLAP

Convergența valorii și iterația politicilor

Modelarea recompensei

Explorare

Generalizare

MDP parțial observabile

Opțiuni

Logistică

TD Lambda

Gradienți politici

Deep Q-Learning

Subiecte în teoria jocurilor

Rezumat și pașii următori

Cerințe

  • Cunoștințe în Python
  • O înțelegere a calculului universitar și a algebrei liniare
  • Înțelegere de bază a probabilității și Statistics
  • .
  • Experiență în crearea de modele de învățare automată în Python și Numpy
  • .

Audiență

  • Dezvoltatorii
  • Cercetători de date
 21 ore

Numărul de participanți


Pret per participant

Categorii înrudite