Schița de curs
Introducere
- Procesul Științei Datelor
- Rolurile și responsabilitățile unui Cercetător de Date (Data Scientist)
Pregătirea Mediului de Dezvoltare
- Biblioteci, cadre, limbaje și unelte
- Dezvoltare locală
- Dezvoltare colaborativă pe web
Colectarea Datelor
-
Tipuri Diferite de Date
-
Structurate
- Baze de date locale
- Conectori de bază de date
- Formate comune: xlxs, XML, Json, csv, ...
-
Ne-structurate
- Clickuri, senzori, smartphoner
- API-uri
- Internetul lucrurilor (IoT)
- Documente, imagini, videoclipuri, sunete
-
Structurate
- Studiu de caz: Colectarea unor cantități mari de date ne-structurate în continuu
Stocarea Datelor
- Baze de date relaționale
- Baze de date ne-relaționale
- Hadoop: Sistem Distribuit de Fișiere (HDFS)
- Spark: Set Distribuit de Date Resistent la Erori (RDD)
- Stocare în cloud
Pregătirea Datelor
- Ingestion, selecție, curățare și transformare
- Asigurarea calității datelor - corectitudine, sensibilitate și securitate
- Rapoarte de excepție
Limbaje folosite pentru Pregătire, Procesare și Analiză
-
Limbajul R
- Introducere în R
- Manipularea datelor, calcul și afișare grafică
-
Python
- Introducere în Python
- Manipularea, procesarea, curățarea și analiza datelor
Analiză a Datelor
-
Analiză exploratorie
- Statisticile de bază
- Prelucrarea vizuală
- Înțelegerea datelor
- Cauzalitatea
- Caracteristicile și transformările
-
Învățarea automată (Machine Learning)
- Supervizat vs. ne-supervizat
- Când să folosiți ce model
- Prelucrarea Limbajului Natural (NLP)
Vizualizarea Datelor
- Cele mai bune practici
- Selectarea graficului potrivit pentru datele potrivite
- Palate de culori
-
Îmbunătățirea la următorul nivel
- Panourile de control (dashboards)
- Vizualizări interactive
- Narrarea poveștilor cu datele
Rezumat și Concluzie
Cerințe
- O înțelegere generală a conceptelor bazei de date
- O cunoaștere de bază a statisticilor
Mărturii (4)
Mi-a plăcut stilul lui Pablo, faptul că a abordat o mulțime de subiecte, de la proiectarea rapoartelor, personalizarea cu html până la implementarea unor algoritmi ML simpli. Good bilanț informații teoretice / exerciții. Pablo a acoperit cu adevărat toate subiectele care m-au interesat și a dat răspunsuri complete la întrebările mele.
Cristian Tudose - SC Automobile Dacia SA
Curs - Advanced Data Analysis with TIBCO Spotfire
Tradus de catre o masina
Aplicarea practică a lui Spotfire și toate funcțiile de bază.
Michael Capili - STMicroelectronics, Inc.
Curs - Introduction to Spotfire
Tradus de catre o masina
Cunoștințe din viața reală de la un specialist din industrie
Matthew Cerbas - Shield Consulting Solutions, Inc.
Curs - Grafana
Tradus de catre o masina
M-am bucurat cu adevărat de mulți laboratoare și practici.
Vivian Feng - Destination Canada
Curs - Data Analysis with SQL, Python and Spotfire
Tradus de catre o masina