Schița de curs

Introducere în Învățarea prin Reinforcare

  • Panoramă generală a învățării prin reinforcare și ale aplicațiilor sale
  • Diferențele între învățarea supraveghere, cea nesupravegheată și cea prin reinforțare
  • Concepte cheie: agenți, mediu, recompense și politică

Procesele de Decizii Markov (MDPs)

  • Compreensiunea stărilor, acțiunilor, recompenselor și tranzițiilor între stări
  • Funcții de valoare și ecuația Bellman
  • Programare dinamică pentru rezolvarea MDPs

Algoritmi Principali RL

  • Metode tabulare: Q-Learning și SARSA
  • Metode bazate pe politici: algoritm REINFORCE
  • Cadre Actor-Critic și aplicațiile lor

Învățare Profundă prin Reinforțare

  • Introducere în Rețele Q-Profunde (DQN)
  • Relatări de experiență și rețele obiective
  • Gradientele politicilor și metode avansate de RL profund

Cadre și Unelte RL

  • Introducere în OpenAI Gym și alte medii RL
  • Utilizarea PyTorch sau TensorFlow pentru dezvoltarea modelelor RL
  • Antrenament, testare și benchmarking a agenților RL

Provocări în RL

  • Echilibrarea explorării și exploatarii în antrenament
  • Gestionarea recompenselor rare și problemelor de atribuire a meritului
  • Scalabilitatea și provocările computaționale ale RL

Activități Practice

  • Implementarea algoritmilor Q-Learning și SARSA de la zero
  • Antrenamentul unui agent bazat pe DQN pentru a juca o joc simplu în OpenAI Gym
  • Tunarea finală a modelelor RL pentru performanță îmbunătățită în medii personalizate

Rezumat și Următoarele Pași

Cerințe

  • Comprehensia solidă a principiilor și algoritmilor de învățare automată
  • Competențe în programarea Python
  • Cunoștințe cu rețele neuronale și cadre de învățare profundă

Publicul țintă

  • Inginerii de învățare automată
  • Specialiștii AI
 14 ore

Numărul de participanți


Pret per participant

Mărturii (1)

Upcoming Courses

Categorii înrudite