Schița de curs

Fundamentele Python pentru Sarcini de Date

  • Instalarea Python și configurarea mediului de dezvoltare
  • Fundamentele limbajului: variabile, tipuri de date, structuri de control
  • Scrierea și rularea unor scripturi Python simple

Manipularea Fișierelor: CSV și Excel

  • Citirea și scrierea fișierelor CSV folosind modulul csv și Pandas
  • Lucrul cu fișiere Excel folosind openpyxl/xlrd și Pandas
  • Exerciții practice: automatizarea conversiilor de fișiere

Introducere în Pandas

  • Bazele DataFrame: creare, indexare, selecție și filtrare
  • Operații de agregare și grupare
  • Operații comune de curățare: valori lipsă, duplicate și conversii de tip

Introducere în Polars

  • Conceptele Polars și caracteristicile de performanță comparativ cu Pandas
  • Operații de bază cu DataFrame în Polars
  • Exemplu de caz de utilizare: când să alegi Polars în loc de Pandas

Transformare Avansată a Datelor (Intermediar)

  • Îmbinări complexe, funcții de fereastră și operații de pivot în Pandas
  • Modele eficiente de procesare a datelor cu Polars
  • Înlănțuirea operațiilor și optimizarea utilizării memoriei

Automatizarea Proceselor cu Python

  • Scrierea de scripturi pentru automatizarea sarcinilor repetitive de date și pași ETL
  • Programarea scripturilor cu planificatoare de sistem sau planificatoare de sarcini
  • Înregistrarea, gestionarea erorilor și notificările

Împachetarea Scripturilor și Cele Mai Bune Practici

  • Crearea de executabile cu PyInstaller sau instrumente similare
  • Structurarea proiectelor, mediile virtuale și gestionarea dependențelor
  • Bazele controlului versiunilor și documentarea fluxurilor de lucru

Mini-Proiect Practic

  • Sarcină de la cap la coadă: citirea fișierelor brute, curățarea și transformarea datelor, producerea rezultatelor
  • Automatizarea fluxului de lucru și împachetarea ca script rulabil sau executabil
  • Revizuire și îmbunătățiri bazate pe feedback-ul colegilor

Rezumat și Pași Următori

Cerințe

  • Familiaritate de bază cu conceptele de programare sau dorința de a învăța
  • Confort în utilizarea liniei de comandă sau a terminalului pentru instalarea pachetelor
  • Experiență în lucrul cu foi de calcul (CSV/Excel)

Publicul țintă

  • Analiști de date și personal de operații care automatizează sarcini de date
  • Ingineri analitici care caută scripturi ETL ușoare
  • Profesioniști interesați de fluxuri de lucru practice bazate pe Python pentru date
 14 Ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite