Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Introducere
Reinforcement Learning Elemente de bază
Tehnici de bază Reinforcement Learning.
Introducere în BURLAP
Convergența valorii și iterația politicilor
Modelarea recompensei
Explorare
Generalizare
MDP parțial observabile
Opțiuni
Logistică
TD Lambda
Gradienți politici
Deep Q-Learning
Subiecte în teoria jocurilor
Rezumat și pașii următori
Cerințe
- Cunoștințe în Python
- O înțelegere a calculului universitar și a algebrei liniare
- Înțelegere de bază a probabilității și Statistics .
- Experiență în crearea de modele de învățare automată în Python și Numpy .
Audiență
- Dezvoltatorii
- Cercetători de date
21 ore