Schița de curs

Introducere

  • Înțelegerea importanței pregătirii datelor în analiză și învățare automată
  • Canalul de pregătire a datelor și rolul său în ciclul de viață al datelor
  • Explorarea provocărilor comune ale datelor brute și impactul asupra analizei

Colectarea și achiziționarea datelor

  • Surse de date: baze de date, API-uri, foi de calcul, fișiere de text și multe altele
  • Tehnici de colectare a datelor și de asigurare a calității datelor în timpul colectării
  • Colectarea datelor din diverse surse

Data Cleaning Tehnici

  • Identificarea și tratarea valorilor lipsă, a valorilor aberante și a neconcordanțelor
  • Gestionarea duplicatelor și a erorilor din setul de date
  • Curățarea seturilor de date din lumea reală

Transformarea și standardizarea datelor

  • Tehnici de normalizare și standardizare a datelor
  • Manipularea datelor categoriale: codificare, binning și ingineria caracteristicilor
  • Transformarea datelor brute în formate utilizabile

Data Integration și Agregarea

  • Fuzionarea și combinarea seturilor de date din diferite surse
  • Rezolvarea conflictelor de date și alinierea tipurilor de date
  • Tehnici de agregare și consolidare a datelor

Data Quality Asigurare

  • Metode de asigurare a calității și integrității datelor pe parcursul întregului proces
  • Punerea în aplicare a verificărilor de calitate și a procedurilor de validare
  • Studii de caz și aplicații practice ale asigurării calității datelor

Reducerea dimensionalității și selectarea caracteristicilor

  • Înțelegerea necesității de reducere a dimensionalității
  • Tehnici precum PCA, selecția caracteristicilor și strategiile de reducere
  • Implementarea tehnicilor de reducere a dimensionalității

Rezumat și etapele următoare

Cerințe

    Înțelegerea de bază a conceptelor de date

Audiență

    Analiști de date Database administratori profesioniști IT
 14 ore

Numărul de participanți



Pret per participant

Mărturii (2)

Cursuri înrudite

Categorii înrudite