Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
Introducere
- Înțelegerea importanței pregătirii datelor în analiza și machine learning
- Tubulajul de pregătire a datelor și rolul său în ciclul de viață al datelor
- Explorarea provocărilor comune din datele brute și impactul lor asupra analizei
Colectarea și Acțiunea Asupra Datelor
- Surse ale datelor: baze de date, API-uri, fețe de calcul, fișiere text, etc.
- Tehnici de colectare a datelor și asigurarea calității acestora în timpul colectării
- Colectarea datelor din diverse surse
Tehnici de Curățare a Datelor
- Identificarea și gestionarea valorilor lipsă, outlier-urilor și incoerențelor
- Gestionarea dublurilor și erorilor din setul de date
- Curățarea seturilor de date din lumea reală
Tehnici de Transformare și Standardizare a Datelor
- Tehnici de normalizare și standardizare a datelor
- Gestionarea datelor categorice: codificare, binning și inginerie de caracteristici
- Transformarea datelor crude în formate utilizabile
Tehnici de Integrare și Agregare a Datelor
- Combinarea seturilor de date din surse diferite
- Rezolvarea conflictelor de date și alinierea tipurilor de date
- Tehnici de agregare și consolidare a datelor
Asigurarea Calității Datelor
- Metode pentru asigurarea calității și integrității datelor în tot procesul
- Implementarea controlurilor de calitate și procedurilor de validare
- Studii de caz și aplicări practice ale asigurării calității datelor
Reducerea Dimensiunii și Selectia Caracteristicilor
- Înțelegerea nevoiei de reducere a dimensiunii
- Tehnici precum PCA, selectia caracteristicilor și strategiile de reducere
- Implementarea tehnicilor de reducere a dimensiunii
Schimbări și Pași Următori
Cerințe
- Cunoștințe de bază ale conceptelor de date
Audiență
- Analisti de date
- Administratori de baze de date
- Profesioniști IT
14 ore
Mărturii (2)
Este o sesiune practică.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Curs - Talend Open Studio for ESB
Tradus de catre o masina
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
Curs - GDPR Workshop
Tradus de catre o masina