Vă mulțumim că ați trimis solicitarea! Un membru al echipei noastre vă va contacta în scurt timp.
Vă mulțumim că ați trimis rezervarea! Un membru al echipei noastre vă va contacta în scurt timp.
Schița de curs
Introducere
Reinforcement Learning Elemente de bază
Tehnici de bază Reinforcement Learning.
Introducere în BURLAP
Convergența valorii și iterația politicilor
Modelarea recompensei
Explorare
Generalizare
MDP parțial observabile
Opțiuni
Logistică
TD Lambda
Gradienți politici
Deep Q-Learning
Subiecte în teoria jocurilor
Rezumat și pașii următori
Cerințe
- Cunoștințe în Python
- O înțelegere a calculului universitar și a algebrei liniare
- Înțelegere de bază a probabilității și Statistics .
- Experiență în crearea de modele de învățare automată în Python și Numpy .
Audiență
- Dezvoltatorii
- Cercetători de date
21 ore