Schița de curs

Introducere în Învățarea prin Reforțare

  • Prezentare generală a învățării prin reforțare și a aplicațiilor sale
  • Diferențe între învățarea supervizată, nesupervizată și cea prin reforțare
  • Concepte cheie: agent, mediu, recompense și politică

Procese de Decizie Markov (MDPs)

  • Înțelegerea stărilor, acțiunilor, recompenselor și tranzițiilor de stare
  • Funcții de valoare și Ecuația Bellman
  • Programare dinamică pentru rezolvarea MDPs

Algoritmi de Bază RL

  • Metode tabelare: Q-Learning și SARSA
  • Metode bazate pe politică: algoritmul REINFORCE
  • Framework-uri Actor-Critic și aplicațiile lor

Învățare Profundă prin Reforțare

  • Introducere în Rețele Deep Q-Networks (DQN)
  • Reluarea experienței și rețele țintă
  • Grade de politică și metode avansate de RL profund

Framework-uri și Instrumente RL

  • Introducere în OpenAI Gym și alte medii RL
  • Utilizarea PyTorch sau TensorFlow pentru dezvoltarea modelelor RL
  • Antrenarea, testarea și evaluarea agenților RL

Provocări în RL

  • Echilibrarea explorării și exploatării în antrenament
  • Gestionarea recompenselor rare și a problemelor de atribuire a creditului
  • Scalabilitatea și provocările de calcul în RL

Activități Practice

  • Implementarea algoritmilor Q-Learning și SARSA de la zero
  • Antrenarea unui agent bazat pe DQN pentru a juca un joc simplu în OpenAI Gym
  • Reglarea fină a modelelor RL pentru îmbunătățirea performanței în medii personalizate

Rezumat și Pași Următori

Cerințe

  • Înțelegere solidă a principiilor și algoritmilor de învățare automată
  • Competență în programarea Python
  • Familiaritate cu rețelele neuronale și framework-urile de învățare profundă

Audiență

  • Ingineri de învățare automată
  • Specialiști în AI
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite