Schița de curs

Introducere

  • Compreensiunea importanței pregătirii datelor în analize și învățarea automatizată
  • Pipeline-ul de pregătire a datelor și rolul său în ciclul vieții datelor
  • Explorarea provocărilor comune ale datelor brute și impactul asupra analizei

Colecționarea și achiziționarea datelor

  • Surse de date: baze de date, API-uri, fișiere Excel, fișiere text și alte surse
  • Tehnici pentru colecționarea datelor și asigurarea calității datelor în timpul colecționării
  • Colecționarea datelor din diverse surse

Data Cleaning Tehnici

  • Identificarea și gestionarea valorilor lipsă, outlier-urilor și neconsistențiilor
  • Gestionarea duplicatelor și a erorilor în setul de date
  • Pregătirea bazelor de date din lumea reală

Transformarea și standardizarea datelor

  • Tehnici pentru normalizarea și standardizarea datelor
  • Gestionarea datelor categorice: codificare, binning și inginerie de caracteristici
  • Transformarea datelor brute în formate utilizabile

Data Integration și Agregarea

  • Combinarea și unirea seturilor de date din surse diferite
  • Rezolvarea conflictelor de date și alinierea tipurilor de date
  • Tehnici pentru agregarea și consolidarea datelor

Data Quality Asigurare

  • Mетоды обеспечения качества и целостности данных на всем протяжении процесса
  • Реализация процедур проверки качества и валидации
  • Кейсы и практическое применение мер по обеспечению качества данных

Уменьшение размерности и выбор признаков

  • Понимание необходимости уменьшения размерности
  • Техники, такие как PCA, отбор признаков и стратегии снижения размерности
  • Реализация техник уменьшения размерности

Итоги и следующие шаги

Resumare și pașii următori

Cerințe

  • Compreensiune de bază a conceptelor de date

Audiență

  • Analizați de date
  • Database administratori
  • Profesionali IT
 14 ore

Numărul de participanți


Pret per participant

Mărturii (2)

Upcoming Courses

Categorii înrudite