Schița de curs
Fundamentele Python pentru sarcini cu date
- Instalarea Python și configurarea mediului de dezvoltare
- Fundamentele limbajului: variabile, tipuri de date, structuri de control
- Scriverea și executarea scripturilor simple în Python
Gestionarea fișierelor: CSV și Excel
- Citirea și scrierea fișierelor CSV folosind modulul csv și Pandas
- Lucrul cu fișierele Excel folosind openpyxl/xlrd și Pandas
- Exerciții practice: automatizarea conversiilor de fișiere
Introducere la Pandas
- Noțiuni de bază ale DataFrame-urilor: creare, indexare, selecție și filtrare
- Operații de agregare și grupare
- Operări comune de curățare: valori lipsă, duplicate și conversii de tip
Introducere la Polars
- Noțiuni ale Polars și caracteristici de performanță comparate cu Pandas
- Operații de bază cu DataFrame în Polars
- Exemplu de utilizare: când să alege Polars în loc de Pandas
Transformarea avansată a datelor (intermediar)
- Joins complexe, funcții de fereastră și operațiuni pivot în Pandas
- Modele eficiente de procesare a datelor cu Polars
- Cadențarea operațiunilor și optimizarea utilizării memoriei
Automatizarea proceselor cu Python
- Scriverea de scripturi pentru automatizarea sarcinilor repetitive și a pașilor ETL
- Schedularea scripturilor folosind planificatorii de sisteme operativo sau planificatorii de sarcini
- Logging, gestionarea erorilor și notificările
Pachetare a scripturilor și bune practici
- Crearea de executabile cu PyInstaller sau instrumente similare
- Structurarea proiectelor, mediile virtuale și gestionarea dependențelor
- Noțiuni de bază de control al versiunilor și documentarea fluxurilor de lucru
Proiect mini-practic hands-on
- Sarcină end-to-end: citirea fișierelor brute, curățarea și transformarea datelor, producerea ieșirilor
- Automatizarea fluxului de lucru și pachetarea ca script executabil sau executable
- Revizuirea și îmbunătățirea pe baza feedback-ului colegilor
Rezumat și următoarele pași
Cerințe
- Cunoaștere basică cu concepte de programare sau dispoziție de a învăța
- Confort în utilizarea liniei de comandă sau terminalului pentru instalarea pachetelor
- Experiență în lucru cu tabelele de calcul (CSV/Excel)
Audiență
- Analiști de date și personal operativ care automatizează sarcinile de date
- Ingineri analitici care caută scripturi ETL ușoare
- Profesionali interesați de fluxuri de lucru bazate pe Python practic
Mărturii (5)
Faptul de a avea mai multe exerciții practice folosind date mai asemănătoare cu cele pe care le folosim în proiectele noastre (imagini satelitare în format raster)
Matthieu - CS Group
Curs - Scaling Data Analysis with Python and Dask
Tradus de catre o masina
Am considerat că antrenatorul era foarte cunoscutitor și a răspuns la întrebări cu încredere pentru a clarifica înțelegerea.
Jenna - TCMT
Curs - Machine Learning with Python – 2 Days
Tradus de catre o masina
Pregătirea și experțiza foarte bune a formatorului, comunicare perfectă în engleză. Cursul a fost practic (exerciții + împărtășire de exemple de cazuri de utilizare)
Monika - Procter & Gamble Polska Sp. z o.o.
Curs - Developing APIs with Python and FastAPI
Tradus de catre o masina
Explicația
Wei Yang Teo - Ministry of Defence, Singapore
Curs - Machine Learning with Python – 4 Days
Tradus de catre o masina
Formatorul dezvoltă formarea în funcție de ritmul participanților
Farris Chua
Curs - Data Analysis in Python using Pandas and Numpy
Tradus de catre o masina