Schița de curs

Machine Learning Introducere

  • Tipuri de învățare a mașinii - supervizat vs nesupervizat
  • Din învățarea statistică la învățarea automată
  • Ciclul de lucru al mineriului de date: înțelegerea afacerii, pregătirea datelor, modelare, implementare
  • Alegerea algoritmului potrivit pentru sarcina
  • Supraajustarea și echilibrul dintre bias și varianță

Python și Prezentare de Biblotece ML

  • Poate să folosim limbaje de programare pentru ML?
  • Alegerea între R și Python
  • Curs rapid de introducere în Python și Jupyter Notebooks
  • Biblitecele Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testarea și Evaluarea Algoritmilor ML

  • Generalizare, supraajustare și validarea modelului
  • Strategii de evaluare: rezervă, cross-validation, bootstrap
  • Metrici pentru regresie: ME, MSE, RMSE, MAPE
  • Metrici pentru clasificare: acuratețe, matricea de confuzie, clase neechilibrate
  • Vizualizarea performanței modelului: curbă profit, curbă ROC, curbă lift
  • Selectia și ajustarea modelului prin căutarea în grilă

Pregătirea Datelor

  • Importul și stocarea datelor în Python
  • Analiza exploratorie și statisticile de bază
  • Gestionarea valorilor lipsă și a outlier-urilor
  • Standardizare, normalizare și transformare
  • Codificarea datelor calitative și manipularea datelor cu pandas

Algoritmi de Clasificare

  • Clasificare binară vs multiclase
  • Regresie logistica și funcțiile discriminante
  • Naïve Bayes, k-vecini ai vecinului
  • Arbori de decizii: CART, Random Forests, Bagging, Boosting, XGBoost
  • Masini de vectori de suport și nucleu
  • Tehnici de învățare prin ensembli

Regresie și Predicții Numerice

  • Cel mai mic pătrat și selecția variabilelor
  • Mетоды регуляризации: L1, L2
  • Регрессия с полиномами и нелинейные модели
  • Деревья регрессии и сплайны

Unsupervised Learning

  • Техники кластеризации: k-средних, k-медиан, иерархическая кластеризация, SOMs
  • Снижение размерности: PCA, факторный анализ, SVD
  • Многомерное масштабирование

Text Mining

  • Предобработка текста и токенизация
  • Bag-of-words, stemming и лемматизация
  • Анализ тональности и частоты слов
  • Визуализация текстовых данных с помощью облаков слов

Системы рекомендаций

  • User-based и item-based коллаборативная фильтрация
  • Проектирование и оценка систем рекомендаций

Мининг ассоциативных правил

  • Частые наборы элементов и алгоритм Apriori
  • Анализ корзины покупок и коэффициент подъема

Обнаружение выбросов

  • Анализ экстремальных значений
  • Методы на основе расстояния и плотности
  • Обнаружение выбросов в многомерных данных

Machine Learning Кейс-стади

  • Понимание бизнес-проблемы
  • Предобработка данных и инженерия функций
  • Выбор модели и настройка параметров
  • Оценка и представление результатов
  • Развертывание

Итоги и следующие шаги

Note: There seems to be a mix-up in the languages used for some parts of the translation, specifically from "Python Regression and Numerical Prediction" onwards. The text has been translated into Russian instead of Romanian. Please correct this section according to your requirements.

Cerințe

  • Compreensiune de bază a statisticilor și algebrei liniare
  • Familiaritate cu conceptele analizei datelor sau inteligenței afacerilor
  • Siguranța în programare (preferabil Python sau R) este recomandată
  • Interes pentru a învăța machine learning aplicat în proiecte bazate pe date

Publicul vizat

  • Analizați de date și cercetători
  • Statisticieni și profesioniști din domeniul cercetării
  • Dezvoltatori și profesioniști IT care exploră instrumentele machine learning
  • Oferința oricui implicat în proiecte de știința datelor sau analize predictiv
 21 ore

Numărul de participanți


Pret per participant

Mărturii (3)

Upcoming Courses

Categorii înrudite