Schița de curs

Introducere în platforma Stratio

  • Prezentare generală a arhitecturii și modulilor principale ale Stratio
  • Rolul modulelor Rocket și Intelligence în ciclul de viață al datelor
  • Conectarea și navigarea în UI-ul Stratio

Lucrul cu modulul Rocket

  • Inghirea datelor și crearea de pipeline-uri
  • Conectarea surselor de date și configurarea transformărilor
  • Utilizarea PySpark pentru sarcinile de preprocesare în Rocket

Elementele esențiale ale PySpark pentru utilizatorii Stratio

  • Structuri de date și operațiuni PySpark
  • Construcții cu bucle: for, while, if/else
  • Scrierea funcțiilor personalizate cu def și aplicarea acestora

Utilizarea avansată a Rocket cu PySpark

  • Inghiarea streaming și transformări
  • Utilizarea buclelor și funcțiilor în scenarii batch și timp real
  • Cele mai bune practici pentru performanța pipeline-urilor PySpark

Explorarea modulului Intelligence

  • Prezentare generală a caracteristicilor de modelare și analiză a datelor
  • Selecția, transformarea și explorarea caracteristicilor
  • Rolul PySpark în analiza personalizată și insight-urile

Construirea fluxurilor de lucru de analiză avansată

  • Crearea funcțiilor definite de utilizator (UDFs) în Intelligence
  • Aplicarea condiționalelor și buclelor pentru logica datelor
  • Cazuri de utilizare: segmentare, agregare și predicție

Implementarea și colaborarea

  • Salvarea, exportul și reutilizarea fluxurilor de lucru
  • Colaborarea cu alți membri ai echipei în Stratio
  • Revizuirea ieșirii și integrarea cu instrumentele de jos

Rezumat și următoarele pași

Cerințe

  • Experiență cu programarea în Python
  • Înțelegerea conceptelor de analiză a datelor sau procesare a big data
  • Cunoștințe de bază ale Apache Spark și calculatoarei distribuite

Audiență

  • Ingineri de date care lucrează pe platforme bazate pe Stratio
  • Analiiți sau dezvoltatori care folosesc modulele Rocket și Intelligence
  • Echipe tehnice care se migrează către fluxurile de lucru PySpark în cadrul Stratio
 14 ore

Numărul de participanți


Pret per participant

Mărturii (4)

Cursuri viitoare

Categorii înrudite