Schița de curs
Modulul 1: Python de Bază pentru Fluxuri de Lucru ML
• Lansarea cursului și configurarea mediului
Alinierea obiectivelor și configurarea unui spațiu de lucru Python ML reproducibil
• Elementele esențiale ale limbajului Python (curs rapid)
Recapitularea sintaxei, fluxului de control, funcțiilor și modelelor utilizate frecvent în bazele de cod ML
• Structuri de date pentru ML
Liste, dicționare, seturi și tuple pentru caracteristici, etichete și metadate
• Comprehensions și instrumente funcționale
Exprimarea transformărilor folosind comprehensions și funcții de ordin superior
• Python orientat pe obiecte pentru dezvoltatorii ML
Clase, metode, compoziție și decizii practice de design
• dataclasses și modelare ușoară
Containere tipizate pentru configurație, exemple și rezultate
• Decoratori și manageri de context
Modele de temporizare, caching, logging și execuție sigură a resurselor
• Lucrul cu fișiere și căi
Gestionarea robustă a seturilor de date și formate de serializare
• Excepții și programare defensivă
Scrierea scripturilor ML care eșuează în siguranță și transparență
• Module, pachete și structura proiectului
Organizarea bazelor de cod ML reutilizabile
• Tipizare și calitatea codului
Sugestii de tip, documentație și structură prietenoasă pentru linting
Modulul 2: Python Numeric, SciPy și Manipularea Datelor
• Fundamentele NumPy pentru calcul vectorizat
Operații eficiente cu array-uri și codare conștientă de performanță
• Indexare, tăiere, difuzare și forme
Manipularea sigură a tensorilor și raționamentul formelor
• Elemente esențiale de algebră liniară cu NumPy și SciPy
Operații stabile cu matrice și descompuneri utilizate în ML
• Scufundare în SciPy
Statistică, optimizare, ajustare a curbelor și matrice rare
• Pandas pentru date tabulare ML
Curățarea, îmbinarea, agregarea și pregătirea seturilor de date
• Scufundare în scikit-learn
Interfața estimatorului, conducte și fluxuri de lucru reproducibile
• Elemente esențiale de vizualizare
Grafice de diagnostic pentru explorarea datelor și comportamentul modelului
Modulul 3: Modele de Programare pentru Construirea Aplicațiilor ML
• De la notebook la proiect menținabil
Refactorizarea codului explorator în pachete structurate
• Managementul configurației
Parametri externi și validare la pornire
• Logging, avertismente și observabilitate
Logging structurat pentru sisteme ML debuggable
• Componente reutilizabile cu OOP și compoziție
Proiectarea de transformatori și predictori extensibili
• Modele practice de design
Conducte, Fabrica sau Registru, Strategie și Modele Adaptor
• Validarea datelor și verificări de schema
Prevenirea problemelor silențioase ale datelor
• Performanță și profilare
Identificarea punctelor de blocare și aplicarea tehnicilor de optimizare
• Interfețe de I/O și inferență ale modelului
Persistență sigură și interfețe de predicție curate
• Construcție mini end-to-end
Conductă ML în stil de producție cu configurație și logging
Modulul 4: Învățare Statistică pentru Date Tabulare, Text și Imagine
• Fundamentele evaluării
Divizarea în antrenare și validare, cross-validation sinceră și metrici aliniate afacerii
• ML tabular avansat
GLM-uri regularizate, ansambluri de arbori și preprocesare fără scurgeri
• Calibrare și incertitudine
Scalare Platt, regresie izotonică, bootstrap și predicție conformă
• Metode NLP clasice
Compromisuri de tokenizare, TF-IDF, modele liniare și Naive Bayes
• Modelarea temelor
Fundamentele LDA și limitări practice
• Vision computerizat clasic
HOG, PCA și conducte bazate pe caracteristici
• Analiza erorilor
Detecția bias-ului, zgomotul etichetelor și corelațiile false
• Laboratoare practice
Conductă tabulară fără scurgeri
Comparație și interpretare a bazeline-ului text
Bazeline de vision clasic cu analiză structurată a eșecurilor
Modulul 5: Rețele Neuronale pentru Date Tabulare, Text și Imagine
• Stăpânirea buclei de antrenament
Bucle PyTorch curate cu AMP, clipping și reproducibilitate
• Optimizare și regularizare
Inițializare, normalizare, optimizatori și planificatori
• Precizie mixtă și scalare
Strategii de acumulare a gradientului și checkpointing
• Rețele neuronale tabulare
Încorporări categorice, traversări de caracteristici și studii de ablație
• Rețele neuronale de text
Încorporări, CNN, BiLSTM sau GRU și manipularea secvențelor
• Rețele neuronale de vision
Fundamentele CNN și arhitecturi de tip ResNet
• Laboratoare practice
Cadru de antrenament reutilizabil
Comparație NN tabular vs boosting
CNN cu experimente de augmentare și planificare
Modulul 6: Arhitecturi Neuronale Avansate
• Strategii de transfer learning
Modele de înghețare și dezmorțire, rate de învățare discriminative
• Arhitecturi Transformer pentru text
Mecanisme de self-attention și abordări de fine-tuning
• Baze de vision și predicție densă
Concepte ResNet, EfficientNet, Vision Transformers și U-Net
• Arhitecturi tabulare avansate
TabTransformer, FT-Transformer și rețele Deep and Cross
• Considerații despre seriile temporale
Divizări temporale și detectarea schimbării covariate
• Tehnici PEFT și de eficiență
Compromisuri LoRA, distilare și cuantizare
• Laboratoare practice
Fine-tuning al unui transformer de text preantrenat
Fine-tuning al unui model de vision preantrenat
Comparație transformer tabular vs GBDT
Modulul 7: Sisteme Generative AI
• Fundamentele prompturilor
Prompting structurat și generare controlată
• Fundamentele LLM
Tokenizare, ajustare a instrucțiunilor și mitigarea halucinațiilor
• Generare Augmentată de Retrieval
Segmentare, încorporări, căutare hibridă și metrici de evaluare
• Strategii de fine-tuning
LoRA și QLoRA cu controale de calitate a datelor
• Modele de difuzie
Intuiția difuziei latente și adaptarea practică
• Date tabulare sintetice
CTGAN și considerente de confidențialitate
• Laboratoare practice
Mini-aplicație RAG în stil de producție
Validarea ieșirilor structurate cu aplicarea schemei
Experimentare opțională cu difuzie
Modulul 8: Agenți AI și MCP
• Designul buclei agentului
Observare, planificare, acțiune, reflectare și persistență
• Arhitecturi ale agenților
ReAct, planificare-și-execută și coordonare multi-agent
• Managementul memoriei
Abordări episodice, semantice și scratchpad
• Integrarea instrumentelor și siguranța
Contracte de instrumente, sandboxing și apărare împotriva injecțiilor de prompt
• Cadre de evaluare
Urme rejucabile, suite de sarcini și testare de regresie
• MCP și interoperabilitate bazată pe protocol
Proiectarea serverelor MCP cu expunere sigură a instrumentelor
• Laboratoare practice
Construirea unui agent de la zero
Expunerea instrumentelor prin server de tip MCP
Crearea unui cadru de evaluare cu constrângeri de siguranță
Cerințe
Participanții ar trebui să aibă cunoștințe de bază în programarea Python.
Acest program este destinat profesioniștilor tehnici de nivel intermediar până la avansat.
Mărturii (2)
ecosistemul ML nu include doar MLFlow, ci și Optuna, hyperops, Docker și Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Curs - MLflow
Tradus de catre o masina
M-a plăcut să particip la instruirea Kubeflow, care a avut loc la distanță. Această instruire mi-a permis să consolidez cunoștințele despre serviciile AWS, K8s și toate instrumentele devOps în jurul Kubeflow, care reprezintă bazele necesare pentru a aborda subiectul cu succes. Vreau să-i mulțumesc lui Malawski Marcin pentru răbdarea sa și profesionalismul demonstrat în instruire și sfaturi privind cele mai bune practici. Malawski abordează subiectul din diferite unghiuri, folosind diferite instrumente de implementare precum Ansible, EKS kubectl, Terraform. Acum sunt cu adevărat convins că intru în domeniul de aplicație potrivit.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Curs - Kubeflow
Tradus de catre o masina