Schița de curs
Fundamentele Python pentru Sarcini de Date
- Instalarea Python și configurarea mediului de dezvoltare
- Fundamentele limbajului: variabile, tipuri de date, structuri de control
- Scrierea și rularea unor scripturi Python simple
Manipularea Fișierelor: CSV și Excel
- Citirea și scrierea fișierelor CSV folosind modulul csv și Pandas
- Lucrul cu fișiere Excel folosind openpyxl/xlrd și Pandas
- Exerciții practice: automatizarea conversiilor de fișiere
Introducere în Pandas
- Bazele DataFrame: creare, indexare, selecție și filtrare
- Operații de agregare și grupare
- Operații comune de curățare: valori lipsă, duplicate și conversii de tip
Introducere în Polars
- Conceptele Polars și caracteristicile de performanță comparativ cu Pandas
- Operații de bază cu DataFrame în Polars
- Exemplu de caz de utilizare: când să alegi Polars în loc de Pandas
Transformare Avansată a Datelor (Intermediar)
- Îmbinări complexe, funcții de fereastră și operații de pivot în Pandas
- Modele eficiente de procesare a datelor cu Polars
- Înlănțuirea operațiilor și optimizarea utilizării memoriei
Automatizarea Proceselor cu Python
- Scrierea de scripturi pentru automatizarea sarcinilor repetitive de date și pași ETL
- Programarea scripturilor cu planificatoare de sistem sau planificatoare de sarcini
- Înregistrarea, gestionarea erorilor și notificările
Împachetarea Scripturilor și Cele Mai Bune Practici
- Crearea de executabile cu PyInstaller sau instrumente similare
- Structurarea proiectelor, mediile virtuale și gestionarea dependențelor
- Bazele controlului versiunilor și documentarea fluxurilor de lucru
Mini-Proiect Practic
- Sarcină de la cap la coadă: citirea fișierelor brute, curățarea și transformarea datelor, producerea rezultatelor
- Automatizarea fluxului de lucru și împachetarea ca script rulabil sau executabil
- Revizuire și îmbunătățiri bazate pe feedback-ul colegilor
Rezumat și Pași Următori
Cerințe
- Familiaritate de bază cu conceptele de programare sau dorința de a învăța
- Confort în utilizarea liniei de comandă sau a terminalului pentru instalarea pachetelor
- Experiență în lucrul cu foi de calcul (CSV/Excel)
Publicul țintă
- Analiști de date și personal de operații care automatizează sarcini de date
- Ingineri analitici care caută scripturi ETL ușoare
- Profesioniști interesați de fluxuri de lucru practice bazate pe Python pentru date
Mărturii (2)
Exercițiile practice legate de conținut ajută cu adevărat la înțelegerea mai profundă a fiecărui subiect. De asemenea, stilul de a începe cursul cu o prezentare teoretică și de a continua cu exerciții practice este bun și util pentru a lega conținutul de ce s-a prezentat anterior.
Nazeera Mohamad - Ministry of Science, Technology and Innovation
Curs - Introduction to Data Science and AI using Python
Tradus de catre o masina
Exemplele/exercițiile perfect adaptate domeniului nostru
Luc - CS Group
Curs - Scaling Data Analysis with Python and Dask
Tradus de catre o masina