Schița de curs

Introducere în Învățarea Roboților

  • Prezentare generală a învățării automate în robotică
  • Învățare supervizată vs nesupervizată vs învățare prin recompensă
  • Aplicații ale RL în control, navigare și manipulare

Fundamentele Învățării prin Recompensă

  • Procese de decizie Markov (MDP)
  • Funcții de politică, valoare și recompensă
  • Compromisuri între explorare și exploatare

Algoritmi Clasici de RL

  • Q-learning și SARSA
  • Metode Monte Carlo și diferențe temporale
  • Iterația valorilor și iterația politicilor

Tehnici de Învățare Profundă prin Recompensă

  • Combinarea învățării profunde cu RL (Deep Q-Networks)
  • Metode ale gradientului politicii
  • Algoritmi avansați: A3C, DDPG și PPO

Medii de Simulare pentru Învățarea Roboților

  • Folosirea OpenAI Gym și ROS 2 pentru simulare
  • Construirea de medii personalizate pentru sarcini robotice
  • Evaluarea performanței și stabilității antrenamentului

Aplicarea RL în Robotică

  • Învățarea politicilor de control și mișcare
  • Învățarea prin recompensă pentru manipularea robotică
  • Învățarea prin recompensă multi-agent în robotică de roi

Optimizare, Implementare și Integrare în Lumea Reală

  • Reglarea hiperparametrilor și modelarea recompenselor
  • Transferul politicilor învățate din simulare în realitate (Sim2Real)
  • Implementarea modelelor antrenate pe hardware robotic

Rezumat și Pași Următori

Cerințe

  • O înțelegere a conceptelor de învățare automată
  • Experiență în programare Python
  • Familiaritate cu robotică și sisteme de control

Publicul Țintă

  • Ingineri de învățare automată
  • Cercetători în robotică
  • Dezvoltatori care construiesc sisteme robotice inteligente
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (1)

Cursuri viitoare

Categorii înrudite