Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Introducere la Reinforcement Learning
- Prezentare generală a învățării prin consolidare și a aplicațiilor sale
- Diferențe între învățarea supravegheată, nesupravegheată și prin consolidare
- Concepte-cheie: agent, mediu, recompense și politică
Procese decizionale Markov (MDP)
- Înțelegerea stărilor, acțiunilor, recompenselor și tranzițiilor de stare
- Funcțiile de valoare și ecuația Bellman
- Programarea dinamică pentru rezolvarea MDP
Algoritmi RL de bază
- Metode tabulare: Q-Learning și SARSA
- Metode bazate pe politici: Algoritmul REINFORCE
- Cadrele Actor-Critic și aplicațiile lor
Adânc Reinforcement Learning
- Introducere în Deep Q-Networks (DQN)
- Reluarea experienței și rețelele țintă
- Gradienți de politică și metode avansate de RL profundă
Cadre și instrumente de RL
- Introducere în OpenAI Gym și alte medii RL
- Utilizarea PyTorch sau TensorFlow pentru dezvoltarea modelului RL
- Formarea, testarea și evaluarea comparativă a agenților RL
Provocări în RL
- Echilibrarea explorării și exploatării în formare
- Gestionarea recompenselor rare și a problemelor de atribuire a creditelor
- Scalabilitate și provocări computaționale în RL
Aplicații practice Activitie
- Implementarea algoritmilor Q-Learning și SARSA de la zero
- Instruirea unui agent bazat pe DQN pentru a juca un joc simplu în OpenAI Gym
- Reglarea fină a modelelor RL pentru îmbunătățirea performanțelor în medii personalizate
Rezumat și pași următori
Cerințe
- Înțelegere aprofundată a principiilor și algoritmilor de învățare automată
- Competențe în programare Python
- Familiaritate cu rețelele neuronale și cadrele de învățare profundă
Audiență
- ingineri în domeniul învățării automate
- Specialiști AI
14 ore
Mărturii (1)
Formatorul răspunde la întrebări în timp real.
Adrian
Curs - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Tradus de catre o masina