Schița de curs
Machine Learning Introducere
- Tipuri de învățare a mașinii - supervizat vs nesupervizat
- Din învățarea statistică la învățarea automată
- Ciclul de lucru al mineriului de date: înțelegerea afacerii, pregătirea datelor, modelare, implementare
- Alegerea algoritmului potrivit pentru sarcina
- Supraajustarea și echilibrul dintre bias și varianță
Python și Prezentare de Biblotece ML
- Poate să folosim limbaje de programare pentru ML?
- Alegerea între R și Python
- Curs rapid de introducere în Python și Jupyter Notebooks
- Biblitecele Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testarea și Evaluarea Algoritmilor ML
- Generalizare, supraajustare și validarea modelului
- Strategii de evaluare: rezervă, cross-validation, bootstrap
- Metrici pentru regresie: ME, MSE, RMSE, MAPE
- Metrici pentru clasificare: acuratețe, matricea de confuzie, clase neechilibrate
- Vizualizarea performanței modelului: curbă profit, curbă ROC, curbă lift
- Selectia și ajustarea modelului prin căutarea în grilă
Pregătirea Datelor
- Importul și stocarea datelor în Python
- Analiza exploratorie și statisticile de bază
- Gestionarea valorilor lipsă și a outlier-urilor
- Standardizare, normalizare și transformare
- Codificarea datelor calitative și manipularea datelor cu pandas
Algoritmi de Clasificare
- Clasificare binară vs multiclase
- Regresie logistica și funcțiile discriminante
- Naïve Bayes, k-vecini ai vecinului
- Arbori de decizii: CART, Random Forests, Bagging, Boosting, XGBoost
- Masini de vectori de suport și nucleu
- Tehnici de învățare prin ensembli
Regresie și Predicții Numerice
- Cel mai mic pătrat și selecția variabilelor
- Mетоды регуляризации: L1, L2
- Регрессия с полиномами и нелинейные модели
- Деревья регрессии и сплайны
Unsupervised Learning
- Техники кластеризации: k-средних, k-медиан, иерархическая кластеризация, SOMs
- Снижение размерности: PCA, факторный анализ, SVD
- Многомерное масштабирование
Text Mining
- Предобработка текста и токенизация
- Bag-of-words, stemming и лемматизация
- Анализ тональности и частоты слов
- Визуализация текстовых данных с помощью облаков слов
Системы рекомендаций
- User-based и item-based коллаборативная фильтрация
- Проектирование и оценка систем рекомендаций
Мининг ассоциативных правил
- Частые наборы элементов и алгоритм Apriori
- Анализ корзины покупок и коэффициент подъема
Обнаружение выбросов
- Анализ экстремальных значений
- Методы на основе расстояния и плотности
- Обнаружение выбросов в многомерных данных
Machine Learning Кейс-стади
- Понимание бизнес-проблемы
- Предобработка данных и инженерия функций
- Выбор модели и настройка параметров
- Оценка и представление результатов
- Развертывание
Итоги и следующие шаги
Note: There seems to be a mix-up in the languages used for some parts of the translation, specifically from "Python Regression and Numerical Prediction" onwards. The text has been translated into Russian instead of Romanian. Please correct this section according to your requirements.Cerințe
- Compreensiune de bază a statisticilor și algebrei liniare
- Familiaritate cu conceptele analizei datelor sau inteligenței afacerilor
- Siguranța în programare (preferabil Python sau R) este recomandată
- Interes pentru a învăța machine learning aplicat în proiecte bazate pe date
Publicul vizat
- Analizați de date și cercetători
- Statisticieni și profesioniști din domeniul cercetării
- Dezvoltatori și profesioniști IT care exploră instrumentele machine learning
- Oferința oricui implicat în proiecte de știința datelor sau analize predictiv
Mărturii (3)
Chiar și cu o zi lipsă din motivul întâlnirilor cu clienții, simt că am o înțelegere mult mai clară a proceselor și tehniciilor folosite în Machine Learning și când ar fi potrivit să folosesc un anumit approachede altul. Întrebarea noastră de acum este să practicăm ceea ce am învățat și să începem să-l aplicăm pe acesta în domeniul nostru de probleme.
Richard Blewett - Rock Solid Knowledge Ltd
Curs - Machine Learning – Data science
Tradus de catre o masina
Îmi place că antrenamentul s-a concentrat pe exemple și codare. Credeam că este imposibil să-ți împachetezi atât de mult conținut în trei zile de antrenament, dar m-am greșit. Antrenamentul a abordat mulți subiecte și totul a fost făcut într-un mod foarte detaliat (în special ajustarea parametrilor modelului - nu mă așteptam ca acest lucru să fie inclus și am fost încântat de surpriză).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
Tradus de catre o masina
Arată multe metode cu scripturi pregătite - materiale foarte bine pregătite și ușor de urmărit înapoi
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
Tradus de catre o masina