Schița de curs

Introducere

  • Procesul Științei Datelor
  • Rolurile și responsabilitățile unui Cercetător de Date (Data Scientist)

Pregătirea Mediului de Dezvoltare

  • Biblioteci, cadre, limbaje și unelte
  • Dezvoltare locală
  • Dezvoltare colaborativă pe web

Colectarea Datelor

  • Tipuri Diferite de Date
    • Structurate
      • Baze de date locale
      • Conectori de bază de date
      • Formate comune: xlxs, XML, Json, csv, ...
    • Ne-structurate
      • Clickuri, senzori, smartphoner
      • API-uri
      • Internetul lucrurilor (IoT)
      • Documente, imagini, videoclipuri, sunete
  • Studiu de caz: Colectarea unor cantități mari de date ne-structurate în continuu

Stocarea Datelor

  • Baze de date relaționale
  • Baze de date ne-relaționale
  • Hadoop: Sistem Distribuit de Fișiere (HDFS)
  • Spark: Set Distribuit de Date Resistent la Erori (RDD)
  • Stocare în cloud

Pregătirea Datelor

  • Ingestion, selecție, curățare și transformare
  • Asigurarea calității datelor - corectitudine, sensibilitate și securitate
  • Rapoarte de excepție

Limbaje folosite pentru Pregătire, Procesare și Analiză

  • Limbajul R
    • Introducere în R
    • Manipularea datelor, calcul și afișare grafică
  • Python
    • Introducere în Python
    • Manipularea, procesarea, curățarea și analiza datelor

Analiză a Datelor

  • Analiză exploratorie
    • Statisticile de bază
    • Prelucrarea vizuală
    • Înțelegerea datelor
  • Cauzalitatea
  • Caracteristicile și transformările
  • Învățarea automată (Machine Learning)
    • Supervizat vs. ne-supervizat
    • Când să folosiți ce model
  • Prelucrarea Limbajului Natural (NLP)

Vizualizarea Datelor

  • Cele mai bune practici
  • Selectarea graficului potrivit pentru datele potrivite
  • Palate de culori
  • Îmbunătățirea la următorul nivel
    • Panourile de control (dashboards)
    • Vizualizări interactive
  • Narrarea poveștilor cu datele

Rezumat și Concluzie

Cerințe

  • O înțelegere generală a conceptelor bazei de date
  • O cunoaștere de bază a statisticilor
 35 ore

Numărul de participanți


Pret per participant

Mărturii (4)

Cursuri viitoare

Categorii înrudite