Schița de curs
Preprocesarea datelor Data Cleaning Integrarea și transformarea datelor Reducerea datelor Discretizarea și generarea ierarhiei de concepte
Inferență statistică Distribuții de probabilitate, Variabile aleatoare, Teorema limită centrală
Prelevarea de probeIntervale de încredereInferență statisticăTestarea ipotezelorRegresie liniară multivariată SpecificațieSelectarea subsetului
EstimareValidarePreviziuneMetode de clasificare Regresie logisticăAnaliza discriminantă liniarăK-cei mai apropiați vecini
Bayes naivCompararea metodelor de clasificareNeural Networks Montarea rețelelor neuronaleProbleme legate de rețelele neuronale de antrenamentArbori de decizie Arbori de regresieArbori de clasificare
Arbori versus modele liniareAmbalare, Random Forests, Boosting BaggingRandom Forests
AmplificareSuport mașini vectoriale și clasificator de marjă maximă cu disc flexibilSuportă clasificatoare vectorialeSuport mașini vectoriale
2 și mai multe clase SVM-uriRelația cu regresia logisticăAnaliza componentelor principaleClustering K-înseamnă clustering
Gruparea K-medoidelorGruparea ierarhicăGrupare bazată pe densitateEvaluarea modelului și tendința de selecție, variația și complexitatea modeluluiEroare de predicție în eșantionAbordarea bayesiană
Validare încrucișatăBootstrap metode