Schița de curs

1. Înțelegerea clasificării folosind cei mai apropiați vecini 

  • Algoritmul kNN 
  • Calcularea distanței 
  • Alegerea unui k potrivit 
  • Pregătirea datelor pentru utilizarea cu kNN 
  • De ce este algoritmul kNN leneș?

2. Înțelegerea naive Bayes 

  • Concepte de bază ale metodelor bayesiene 
  • Probabilitate 
  • Probabilitate comună
  • Probabilitate condiționată cu teorema lui Bayes 
  • Algoritmul naive Bayes 
  • Clasificarea naive Bayes 
  • Estimatorul Laplace
  • Utilizarea caracteristicilor numerice cu naive Bayes

3. Înțelegerea arborilor de decizie 

  • Divide et impera 
  • Algoritmul de arbore de decizie C5.0 
  • Alegerea celei mai bune divizări 
  • Trunchierea arborelui de decizie

4. Înțelegerea regulilor de clasificare 

  • Separă și cucerește 
  • Algoritmul One Rule 
  • Algoritmul RIPPER 
  • Reguli din arbori de decizie

5. Înțelegerea regresiei 

  • Regresie liniară simplă 
  • Estimarea celor mai mici pătrate ordinare 
  • Corelații 
  • Regresie liniară multiplă

6. Înțelegerea arborilor de regresie și a arborilor de model 

  • Adăugarea regresiei la arbori

7. Înțelegerea rețelelor neuronale 

  • De la neuroni biologici la neuroni artificiali 
  • Funcții de activare 
  • Topologia rețelei 
  • Numărul de straturi 
  • Direcția de circulație a informațiilor 
  • Numărul de noduri din fiecare strat 
  • Antrenarea rețelelor neuronale cu backpropagation

8. Înțelegerea Mașinilor cu Vectori de Suport 

  • Clasificare cu hiperplane 
  • Găsirea marginii maxime 
  • Cazul datelor liniar separabile 
  • Cazul datelor neliniar separabile 
  • Utilizarea nucleelor pentru spații neliniare

9. Înțelegerea regulilor de asociere 

  • Algoritmul Apriori pentru învățarea regulilor de asociere 
  • Măsurarea interesului regulilor – suport și încredere 
  • Construirea unui set de reguli cu principiul Apriori

10. Înțelegerea clusterizării

  • Clusterizarea ca sarcină de învățare automată
  • Algoritmul k-means pentru clusterizare 
  • Utilizarea distanței pentru atribuirea și actualizarea clusterelor 
  • Alegerea numărului potrivit de clustere

11. Măsurarea performanței pentru clasificare 

  • Lucrul cu date de predicție de clasificare 
  • O privire mai atentă asupra matricelor de confuzie 
  • Utilizarea matricelor de confuzie pentru măsurarea performanței 
  • Dincolo de acuratețe – alte măsuri de performanță 
  • Statistica kappa 
  • Sensibilitate și specificitate 
  • Precizie și rechemare 
  • Măsura F 
  • Vizualizarea compromisurilor de performanță 
  • Curbe ROC 
  • Estimarea performanței viitoare 
  • Metoda holdout 
  • Validare încrucișată 
  • Eșantionare bootstrap

12. Reglarea modelelor de stoc pentru o performanță mai bună 

  • Utilizarea caret pentru reglarea automată a parametrilor 
  • Crearea unui model reglat simplu 
  • Personalizarea procesului de reglare 
  • Îmbunătățirea performanței modelului cu meta-învățare 
  • Înțelegerea ansamblurilor 
  • Bagging 
  • Boosting 
  • Păduri aleatoare 
  • Antrenarea pădurilor aleatoare
  • Evaluarea performanței pădurilor aleatoare

13. Învățare Profundă

  • Trei clase de Învățare Profundă
  • Autoencodere Profunde
  • Rețele Neuronale Profunde Preantrenate
  • Rețele de Stivă Profunde

14. Discuție despre Arii Specifice de Aplicare

 21 Ore

Numărul de participanți


Pret per participant

Mărturii (1)

Cursuri viitoare

Categorii înrudite