Schița de curs

Introducere

  • Rezolvarea problemelor din lumea reală prin interacțiuni de tip trial-and-error

Înțelegerea sistemelor de învățare adaptivă și Artificial Intelligence (AI).

Cum percep agenții starea

Cum să recompensezi un agent

Studiu de caz: Interacțiunea cu vizitatorii site-ului web

Pregătirea mediului pentru agent

O scufundare profundă în algoritmi Reinforcement Learning

Metode bazate pe valoare vs. metode bazate pe politici

Alegerea unui model Reinforcement Learning Model

Utilizarea algoritmului Q-Learning Model-Free Reinforcement Learning Algoritm

Proiectarea agentului

Studiu de caz: Asistenți inteligenți

Interfațarea agentului cu un mediu de producție

Măsurarea rezultatelor acțiunilor agenților

Depanare

Rezumat și concluzii

Cerințe

  • O înțelegere generală a învățării prin întărire
  • Experiență cu învățarea mașinilor
  • Java experiență în programare

Audiență

  • Științifici de date
  21 ore
 

Numărul de participanți


Dată început

Dată sfârșit


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Mărturii (4)

Cursuri înrudite

Categorii înrudite