Curs de pregatire Jupyter pentru echipe de știința datelor
Jupyter este un mediu de dezvoltare interactiv, bazat pe web, open-source.
Acest training condus de un instructor, live (online sau la fața locului) introduce ideea dezvoltării collaborative în știința datelor și demonstrează cum să folosiți Jupyter pentru a urmări și a participa ca echipă la „ciclu de viață al unei idei computationale”. Acest training ghidează participanții prin crearea unui proiect exemplu de știința datelor bazat pe ecosistemul Jupyter.
La finalul acestui training, participanții vor putea:
- Instala și configura Jupyter, inclusiv crearea și integrarea unui depozit de echipă pe Git.
- Folosi funcționalități Jupyter precum extensii, widget-uri interactive, modul multiutilizator și multe altele pentru a facilita colaborarea la proiecte.
- Crea, partaja și organiza Jupyter Notebooks cu membrii echipei.
- Alege între Scala, Python, R pentru a scrie și executa cod pe sisteme de date mari precum Apache Spark, toate prin interfața Jupyter.
Formatul cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Jupyter Notebook suportă peste 40 de limbaje, inclusiv R, Python, Scala, Julia, etc. Pentru a personaliza acest curs la limbajele dumneavoastră preferate, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere în Jupyter
- Prezentare generală a Jupyter și a ecosistemului său
- Instalare și configurare
- Configurarea Jupyter pentru colaborare în echipă
Funcționalități collaborative
- Folosirea Git pentru controlul versiunilor
- Extensii și widget-uri interactive
- Modul multiutilizator
Crearea și gestionarea Notebooks
- Structura și funcționalitatea Notebooks
- Partajarea și organizarea Notebooks
- Bune practici pentru colaborare
Programare cu Jupyter
- Alegerea și utilizarea limbajelor de programare (Python, R, Scala)
- Scrierea și executarea codului
- Integrarea cu sisteme de date mari (Apache Spark)
Funcționalități avansate ale Jupyter
- Personalizarea mediului Jupyter
- Automatizarea fluxurilor de lucru cu Jupyter
- Explorarea cazurilor de utilizare avansate
Sesiuni practice
- Laboratoare practice
- Proiecte de știința datelor din lumea reală
- Exerciții de grup și evaluări între colegi
Rezumat și pași următori
Cerințe
- Experiență în programare în limbaje precum Python, R, Scala, etc.
- Cunoștințe în domeniul științei datelor
Public țintă
- Echipe de știința datelor
Cursurile publice necesita 5+ participanti
Curs de pregatire Jupyter pentru echipe de știința datelor - Rezervare
Curs de pregatire Jupyter pentru echipe de știința datelor - Solicitare
Jupyter pentru echipe de știința datelor - Cerere de consultanta
Mărturii (1)
Este foarte bine că cursul a fost personalizat pentru principalele domenii pe care le-am evidențiat în chestionarul pre-curs. Acest lucru ajută cu adevărat la abordarea întrebărilor pe care le am în privința materiei și la alinierea cu obiectivele mele de învățare.
Winnie Chan - Statistics Canada
Curs - Jupyter for Data Science Teams
Tradus de catre o masina
Cursuri viitoare
Cursuri înrudite
Introducere în Știința Datelor și AI folosind Python
35 OreExplorează abordări practice ale Științei Datelor și AI folosind Python — echipează profesioniștii cu abilitățile necesare pentru a explora date, a construi modele de învățare automată și a implementa aplicații bazate pe AI în contexte de afaceri; Acoperă fluxuri de lucru CRISP-DM, analiză statistică, învățare supervizată și nesupervizată, învățare profundă cu Tensorflow, procesare de limbaj natural, date mari cu Spark și povestire bazată pe date; Ideal pentru începătorii care caută o certificare în știința datelor cu Python și pregătire pentru carieră în analitică.
Apache Airflow pentru Știința Datelor: Automatizarea Pipeline-urilor de Învățare Automată
21 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat participanților de nivel intermediar care doresc să automatizeze și să gestioneze fluxurile de lucru de învățare automată, inclusiv antrenarea, validarea și implementarea modelelor folosind Apache Airflow.
La finalul acestui training, participanții vor putea:
- Să configureze Apache Airflow pentru orchestrarea fluxurilor de lucru de învățare automată.
- Să automatizeze sarcinile de preprocesare a datelor, antrenare a modelelor și validare.
- Să integreze Airflow cu cadre și instrumente de învățare automată.
- Să implementeze modele de învățare automată folosind pipeline-uri automate.
- Să monitorizeze și să optimizeze fluxurile de lucru de învățare automată în producție.
Ecosistemul Anaconda pentru Oamenii de Știință a Datelor
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință a datelor care doresc să utilizeze ecosistemul Anaconda pentru a captura, gestiona și implementa pachete și fluxuri de lucru de analiză a datelor într-o singură platformă.
La finalul acestui training, participanții vor putea:
- Instala și configura componentele și bibliotecile Anaconda.
- Înțelege conceptele de bază, caracteristicile și beneficiile Anaconda.
- Gestiona pachete, medii și canale folosind Anaconda Navigator.
- Utiliza pachete Conda, R și Python pentru știința datelor și învățarea automată.
- Să cunoască câteva cazuri practice și tehnici pentru gestionarea mai multor medii de date.
AWS Cloud9 pentru Știința Datelor
28 OreAceastă formare condusă de un instructor, live în România (online sau la fața locului) este destinată cercetătorilor de date și analiștilor de nivel intermediar care doresc să folosească AWS Cloud9 pentru fluxuri de lucru eficiente în știința datelor.
La finalul acestei formări, participanții vor putea:
- Să configureze un mediu de știința datelor în AWS Cloud9.
- Să efectueze analize de date folosind Python, R și Jupyter Notebook în Cloud9.
- Să integreze AWS Cloud9 cu serviciile de date AWS precum S3, RDS și Redshift.
- Să utilizeze AWS Cloud9 pentru dezvoltarea și implementarea modelelor de învățare automată.
- Să optimizeze fluxurile de lucru bazate pe cloud pentru analiza și procesarea datelor.
Introducere în Google Colab pentru Știința Datelor
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat începătorilor în domeniul științei datelor și profesioniștilor IT care doresc să învețe elementele de bază ale științei datelor folosind Google Colab.
La finalul acestui training, participanții vor fi capabili să:
- Să configureze și să navigheze în Google Colab.
- Să scrie și să execute cod Python de bază.
- Să importe și să manipuleze seturi de date.
- Să creeze vizualizări folosind biblioteci Python.
Știința datelor esențială pentru profesioniști în Marketing/Vânzări
21 Ore
Acest curs este destinat profesioniștilor în Marketing și Vânzări care doresc să aprofundeze aplicarea științei datelor în Marketing/Vânzări. Cursul oferă
o acoperire detaliată a diferitelor tehnici de știință a datelor utilizate pentru „upsale”, „cross-sale”, segmentarea pieței, branding și CLV.
Diferența dintre Marketing și Vânzări - Cum diferă vânzările de marketing?
În termeni simpli, vânzările pot fi definite ca un proces care se concentrează sau se adresează indivizilor sau unor grupuri mici. Pe de altă parte, marketingul se adresează unui grup mai larg sau publicului general. Marketingul include cercetarea (identificarea nevoilor clientului), dezvoltarea produselor (producerea de produse inovatoare) și promovarea produsului (prin reclame) și crearea de conștientizare despre produs în rândul consumatorilor. Astfel, marketingul înseamnă generarea de lead-uri sau prospecte. Odată ce produsul este lansat pe piață, este sarcina vânzătorului să îl convingă pe client să cumpere produsul. Vânzările înseamnă transformarea lead-urilor sau prospectelor în achiziții și comenzi, în timp ce marketingul este orientat către obiective pe termen lung, iar vânzările se referă la obiective pe termen scurt.
Kaggle
14 OreAcest training condus de un instructor, live în România (online sau la fața locului) este destinat specialiștilor în știința datelor și dezvoltatorilor care doresc să învețe și să-și construiască o carieră în Știința Datelor folosind Kaggle.
La finalul acestui training, participanții vor putea:
- Să învețe despre știința datelor și învățarea automată.
- Să exploreze analiza datelor.
- Să învețe despre Kaggle și cum funcționează.
Știința Datelor cu Platforma KNIME Analytics
21 OrePlatforma KNIME Analytics este o opțiune open source de top pentru inovația bazată pe date, ajutându-vă să descoperiți potențialul ascuns în datele dumneavoastră, să extrageți noi perspective sau să preziceți viitorul. Cu peste 1000 de module, sute de exemple gata de rulat, o gamă cuprinzătoare de instrumente integrate și cea mai variată selecție de algoritmi avansați disponibili, Platforma KNIME Analytics este cutia de instrumente perfectă pentru orice specialist în date și analist de afaceri.
Acest curs pentru Platforma KNIME Analytics este o oportunitate ideală pentru începători, utilizatori avansați și experți KNIME să fie introduși în KNIME, să învețe cum să îl folosească mai eficient și cum să creeze rapoarte clare și cuprinzătoare bazate pe fluxuri de lucru KNIME.
Această instruire condusă de un instructor, live (online sau la fața locului), este destinată profesioniștilor din domeniul datelor care doresc să folosească KNIME pentru a rezolva nevoi complexe de afaceri.
Este destinată publicului care nu cunoaște programarea și intenționează să folosească instrumente de ultimă oră pentru a implementa scenarii de analiză.
La sfârșitul acestei instruiri, participanții vor putea:
- Instala și configura KNIME.
- Construi scenarii de Știința Datelor.
- Antrena, testa și valida modele.
- Implementa lanțul de valoare de la cap la capăt al modelelor de știință a datelor.
Formatul Cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o instruire personalizată pentru acest curs sau pentru a afla mai multe despre acest program, vă rugăm să ne contactați pentru a aranja.
Învățare Automată pentru Știința Datelor cu Python
21 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat analiștilor de date de nivel intermediar, dezvoltatorilor sau viitorilor specialiști în știința datelor care doresc să aplice tehnici de învățare automată în Python pentru a extrage informații, a face predicții și a automatiza deciziile bazate pe date.
La finalul acestui curs, participanții vor putea:
- Să înțeleagă și să diferențieze paradigmele cheie ale învățării automate.
- Să exploreze tehnici de preprocesare a datelor și metrici de evaluare a modelelor.
- Să aplice algoritmi de învățare automată pentru a rezolva probleme reale din domeniul datelor.
- Să utilizeze biblioteci Python și Jupyter Notebooks pentru dezvoltare practică.
- Să construiască modele pentru predicție, clasificare, recomandare și clustering.
Introducere în Modele Pre-antrenate
14 OreAceastă formare condusă de un instructor, live în România (online sau la fața locului), este destinată profesioniștilor de nivel începător care doresc să înțeleagă conceptul de modele pre-antrenate și să învețe cum să le aplice pentru a rezolva probleme din lumea reală fără a construi modele de la zero.
La sfârșitul acestei formări, participanții vor putea:
- Înțelege conceptul și beneficiile modelelor pre-antrenate.
- Explora diverse arhitecturi de modele pre-antrenate și cazurile lor de utilizare.
- Fine-tune un model pre-antrenat pentru sarcini specifice.
- Implementa modele pre-antrenate în proiecte simple de învățare automată.
Programare în Python pentru Finanțe
35 OrePython este un limbaj de programare care a câștigat o popularitate imensă în industria financiară. Adoptat de cele mai mari bănci de investiții și fonduri de hedging, este folosit pentru a construi o gamă largă de aplicații financiare, de la programe de tranzacționare până la sisteme de gestionare a riscurilor.
În acest training condus de un instructor, participanții vor învăța cum să utilizeze Python pentru a dezvolta aplicații practice care să rezolve o serie de probleme specifice legate de finanțe.
La sfârșitul acestui training, participanții vor putea:
- Să înțeleagă elementele de bază ale limbajului de programare Python
- Să descarce, să instaleze și să întrețină cele mai bune instrumente de dezvoltare pentru crearea de aplicații financiare în Python
- Să selecteze și să utilizeze cele mai potrivite pachete Python și tehnici de programare pentru a organiza, vizualiza și analiza date financiare din diverse surse (CSV, Excel, baze de date, web etc.)
- Să construiască aplicații care să rezolve probleme legate de alocarea activelor, analiza riscurilor, performanța investițiilor și multe altele
- Să depaneze, să integreze, să implementeze și să optimizeze o aplicație Python
Publicul țintă
- Dezvoltatori
- Analiști
- Quants
Formatul cursului
- Parțial curs, parțial discuții, exerciții și practică intensă
Notă
- Acest training are ca scop să ofere soluții pentru unele dintre principalele probleme cu care se confruntă profesioniștii din domeniul financiar. Cu toate acestea, dacă aveți un subiect, un instrument sau o tehnică specifică pe care doriți să o adăugați sau să o dezvoltați mai detaliat, vă rugăm să ne contactați pentru a aranja.
Știința Datelor pe GPU cu NVIDIA RAPIDS
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință și dezvoltatorilor care doresc să folosească RAPIDS pentru a construi fluxuri de date accelerate pe GPU, fluxuri de lucru și vizualizări, aplicând algoritmi de învățare automată, cum ar fi XGBoost, cuML etc.
La finalul acestui training, participanții vor putea:
- Să configureze mediul de dezvoltare necesar pentru a construi modele de date cu NVIDIA RAPIDS.
- Să înțeleagă caracteristicile, componentele și avantajele RAPIDS.
- Să utilizeze GPU-uri pentru a accelera fluxurile de date și analize de la un capăt la altul.
- Să implementeze pregătirea datelor accelerate pe GPU și ETL cu cuDF și Apache Arrow.
- Să învețe cum să execute sarcini de învățare automată cu algoritmii XGBoost și cuML.
- Să construiască vizualizări de date și să execute analize grafice cu cuXfilter și cuGraph.