Cursuri de pregatire Jupyter pentru echipe de știința datelor
Jupyter este un mediu de dezvoltare interactiv, bazat pe web, open-source.
Acest training condus de un instructor, live (online sau la fața locului) introduce ideea dezvoltării collaborative în știința datelor și demonstrează cum să folosiți Jupyter pentru a urmări și a participa ca echipă la „ciclu de viață al unei idei computationale”. Acest training ghidează participanții prin crearea unui proiect exemplu de știința datelor bazat pe ecosistemul Jupyter.
La finalul acestui training, participanții vor putea:
- Instala și configura Jupyter, inclusiv crearea și integrarea unui depozit de echipă pe Git.
- Folosi funcționalități Jupyter precum extensii, widget-uri interactive, modul multiutilizator și multe altele pentru a facilita colaborarea la proiecte.
- Crea, partaja și organiza Jupyter Notebooks cu membrii echipei.
- Alege între Scala, Python, R pentru a scrie și executa cod pe sisteme de date mari precum Apache Spark, toate prin interfața Jupyter.
Formatul cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Jupyter Notebook suportă peste 40 de limbaje, inclusiv R, Python, Scala, Julia, etc. Pentru a personaliza acest curs la limbajele dumneavoastră preferate, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere în Jupyter
- Prezentare generală a Jupyter și a ecosistemului său
- Instalare și configurare
- Configurarea Jupyter pentru colaborare în echipă
Funcționalități collaborative
- Folosirea Git pentru controlul versiunilor
- Extensii și widget-uri interactive
- Modul multiutilizator
Crearea și gestionarea Notebooks
- Structura și funcționalitatea Notebooks
- Partajarea și organizarea Notebooks
- Bune practici pentru colaborare
Programare cu Jupyter
- Alegerea și utilizarea limbajelor de programare (Python, R, Scala)
- Scrierea și executarea codului
- Integrarea cu sisteme de date mari (Apache Spark)
Funcționalități avansate ale Jupyter
- Personalizarea mediului Jupyter
- Automatizarea fluxurilor de lucru cu Jupyter
- Explorarea cazurilor de utilizare avansate
Sesiuni practice
- Laboratoare practice
- Proiecte de știința datelor din lumea reală
- Exerciții de grup și evaluări între colegi
Rezumat și pași următori
Cerințe
- Experiență în programare în limbaje precum Python, R, Scala, etc.
- Cunoștințe în domeniul științei datelor
Public țintă
- Echipe de știința datelor
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Jupyter pentru echipe de știința datelor - Rezervare
Cursuri de pregatire Jupyter pentru echipe de știința datelor - Solicitare
Jupyter pentru echipe de știința datelor - Cerere de consultanta
Mărturii (1)
Este foarte bine că cursul a fost personalizat pentru principalele domenii pe care le-am evidențiat în chestionarul pre-curs. Acest lucru ajută cu adevărat la abordarea întrebărilor pe care le am în privința materiei și la alinierea cu obiectivele mele de învățare.
Winnie Chan - Statistics Canada
Curs - Jupyter for Data Science Teams
Tradus de catre o masina
Cursuri viitoare
Cursuri înrudite
Introducere în Știința Datelor și AI folosind Python
35 OreAcesta este un curs introductiv de 5 zile în Știința Datelor și Inteligența Artificială (AI).
Cursul este prezentat cu exemple și exerciții folosind Python.
Ecosistemul Anaconda pentru Oamenii de Știință a Datelor
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință a datelor care doresc să utilizeze ecosistemul Anaconda pentru a captura, gestiona și implementa pachete și fluxuri de lucru de analiză a datelor într-o singură platformă.
La finalul acestui training, participanții vor putea:
- Instala și configura componentele și bibliotecile Anaconda.
- Înțelege conceptele de bază, caracteristicile și beneficiile Anaconda.
- Gestiona pachete, medii și canale folosind Anaconda Navigator.
- Utiliza pachete Conda, R și Python pentru știința datelor și învățarea automată.
- Să cunoască câteva cazuri practice și tehnici pentru gestionarea mai multor medii de date.
O introducere practică în Știința Datelor
35 OreParticipanții care finalizează acest training vor dobândi o înțelegere practică și aplicabilă în lumea reală a Științei Datelor, precum și a tehnologiilor, metodelor și instrumentelor aferente.
Participanții vor avea ocazia să pună în practică aceste cunoștințe prin exerciții practice. Interacțiunea în grup și feedback-ul instructorului constituie o componentă importantă a cursului.
Cursul începe cu o introducere în conceptele de bază ale Științei Datelor, după care progresează către instrumentele și metodele utilizate în domeniu.
Public țintă
- Dezvoltatori
- Analiști tehnici
- Consultanți IT
Formatul cursului
- Partea teoretică, discuții, exerciții și practică intensivă
Notă
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Știința Datelor pentru Analiza Big Data
35 OreBig data se referă la seturi de date atât de voluminoase și complexe încât software-urile tradiționale de procesare a datelor sunt inadecvate pentru a le gestiona. Provocările big data includ capturarea datelor, stocarea datelor, analiza datelor, căutarea, partajarea, transferul, vizualizarea, interogarea, actualizarea și confidențialitatea informațiilor.
Știința datelor esențială pentru profesioniști în Marketing/Vânzări
21 Ore
Acest curs este destinat profesioniștilor în Marketing și Vânzări care doresc să aprofundeze aplicarea științei datelor în Marketing/Vânzări. Cursul oferă
o acoperire detaliată a diferitelor tehnici de știință a datelor utilizate pentru „upsale”, „cross-sale”, segmentarea pieței, branding și CLV.
Diferența dintre Marketing și Vânzări - Cum diferă vânzările de marketing?
În termeni simpli, vânzările pot fi definite ca un proces care se concentrează sau se adresează indivizilor sau unor grupuri mici. Pe de altă parte, marketingul se adresează unui grup mai larg sau publicului general. Marketingul include cercetarea (identificarea nevoilor clientului), dezvoltarea produselor (producerea de produse inovatoare) și promovarea produsului (prin reclame) și crearea de conștientizare despre produs în rândul consumatorilor. Astfel, marketingul înseamnă generarea de lead-uri sau prospecte. Odată ce produsul este lansat pe piață, este sarcina vânzătorului să îl convingă pe client să cumpere produsul. Vânzările înseamnă transformarea lead-urilor sau prospectelor în achiziții și comenzi, în timp ce marketingul este orientat către obiective pe termen lung, iar vânzările se referă la obiective pe termen scurt.
Introducere în Știința Datelor
35 OreAcest training condus de un instructor, live (online sau la fața locului), este destinat profesioniștilor care doresc să înceapă o carieră în Știința Datelor.
La finalul acestui training, participanții vor putea:
- Să instaleze și să configureze Python și MySql.
- Să înțeleagă ce este Știința Datelor și cum poate adăuga valoare aproape oricărei afaceri.
- Să învețe elementele de bază ale programării în Python.
- Să învețe tehnici de învățare automată supervizată și nesupervizată, și cum să le implementeze și să interpreteze rezultatele.
Formatul Cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Kaggle
14 OreAcest training condus de un instructor, live în România (online sau la fața locului) este destinat specialiștilor în știința datelor și dezvoltatorilor care doresc să învețe și să-și construiască o carieră în Știința Datelor folosind Kaggle.
La finalul acestui training, participanții vor putea:
- Să învețe despre știința datelor și învățarea automată.
- Să exploreze analiza datelor.
- Să învețe despre Kaggle și cum funcționează.
Fundamentele MATLAB, Știința Datelor și Generarea de Rapoarte
35 OreÎn prima parte a acestui training, acoperim elementele de bază ale MATLAB și funcția sa atât ca limbaj, cât și ca platformă. Această discuție include o introducere în sintaxa MATLAB, array-uri și matrice, vizualizarea datelor, dezvoltarea de scripturi și principiile de programare orientată pe obiecte.
În a doua parte, demonstrăm cum să folosim MATLAB pentru data mining, învățarea automată și analiza predictivă. Pentru a oferi participanților o perspectivă clară și practică asupra abordării și puterii MATLAB, facem comparații între utilizarea MATLAB și a altor instrumente precum foile de calcul, C, C++ și Visual Basic.
În a treia parte a trainingului, participanții învață cum să-și streamlineze munca prin automatizarea procesării datelor și generarea de rapoarte.
De-a lungul cursului, participanții vor pune în practică conceptele învățate prin exerciții practice într-un mediu de laborator. La finalul trainingului, participanții vor avea o înțelegere profundă a capacităților MATLAB și vor putea să-l folosească pentru a rezolva probleme reale din domeniul științei datelor, precum și pentru a-și eficientiza munca prin automatizare.
Evaluări vor fi efectuate pe parcursul cursului pentru a măsura progresul.
Formatul Cursului
- Cursul include exerciții teoretice și practice, inclusiv discuții de caz, inspecția codului de exemplu și implementarea practică.
Notă
- Sesiunile de practică se vor baza pe șabloane de rapoarte cu date predefinite. Dacă aveți cerințe specifice, vă rugăm să ne contactați pentru a aranja.
Învățare Automată pentru Știința Datelor cu Python
21 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat analiștilor de date de nivel intermediar, dezvoltatorilor sau viitorilor specialiști în știința datelor care doresc să aplice tehnici de învățare automată în Python pentru a extrage informații, a face predicții și a automatiza deciziile bazate pe date.
La finalul acestui curs, participanții vor putea:
- Să înțeleagă și să diferențieze paradigmele cheie ale învățării automate.
- Să exploreze tehnici de preprocesare a datelor și metrici de evaluare a modelelor.
- Să aplice algoritmi de învățare automată pentru a rezolva probleme reale din domeniul datelor.
- Să utilizeze biblioteci Python și Jupyter Notebooks pentru dezvoltare practică.
- Să construiască modele pentru predicție, clasificare, recomandare și clustering.
Accelerarea Fluxurilor de Lucru Python Pandas cu Modin
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință și dezvoltatorilor care doresc să folosească Modin pentru a construi și implementa calcule paralele cu Pandas pentru o analiză de date mai rapidă.
La sfârșitul acestui training, participanții vor putea:
- Să configureze mediul necesar pentru a începe dezvoltarea fluxurilor de lucru Pandas la scară largă cu Modin.
- Să înțeleagă caracteristicile, arhitectura și avantajele Modin.
- Să cunoască diferențele dintre Modin, Dask și Ray.
- Să efectueze operațiuni Pandas mai rapid cu Modin.
- Să implementeze întreaga API și funcții Pandas.
Programare în Python pentru Finanțe
35 OrePython este un limbaj de programare care a câștigat o popularitate imensă în industria financiară. Adoptat de cele mai mari bănci de investiții și fonduri de hedging, este folosit pentru a construi o gamă largă de aplicații financiare, de la programe de tranzacționare până la sisteme de gestionare a riscurilor.
În acest training condus de un instructor, participanții vor învăța cum să utilizeze Python pentru a dezvolta aplicații practice care să rezolve o serie de probleme specifice legate de finanțe.
La sfârșitul acestui training, participanții vor putea:
- Să înțeleagă elementele de bază ale limbajului de programare Python
- Să descarce, să instaleze și să întrețină cele mai bune instrumente de dezvoltare pentru crearea de aplicații financiare în Python
- Să selecteze și să utilizeze cele mai potrivite pachete Python și tehnici de programare pentru a organiza, vizualiza și analiza date financiare din diverse surse (CSV, Excel, baze de date, web etc.)
- Să construiască aplicații care să rezolve probleme legate de alocarea activelor, analiza riscurilor, performanța investițiilor și multe altele
- Să depaneze, să integreze, să implementeze și să optimizeze o aplicație Python
Publicul țintă
- Dezvoltatori
- Analiști
- Quants
Formatul cursului
- Parțial curs, parțial discuții, exerciții și practică intensă
Notă
- Acest training are ca scop să ofere soluții pentru unele dintre principalele probleme cu care se confruntă profesioniștii din domeniul financiar. Cu toate acestea, dacă aveți un subiect, un instrument sau o tehnică specifică pe care doriți să o adăugați sau să o dezvoltați mai detaliat, vă rugăm să ne contactați pentru a aranja.
Python în Știința Datelor
35 OreCursul de formare îi va ajuta pe participanți să se pregătească pentru Dezvoltarea Aplicațiilor Web folosind Programarea în Python cu Analiza Datelor. O astfel de vizualizare a datelor este un instrument valoros pentru Managementul de Top în procesul de luare a deciziilor.
Qlik Sense pentru Știința Datelor
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat analiștilor de date și dezvoltatorilor web care doresc să dezvolte modele asociative în Qlik Sense.
La finalul acestui training, participanții vor putea:
- Aplica Qlik Sense în știința datelor.
- Utiliza și naviga în interfața Qlik Sense.
- Construi o forță de muncă alfabetizată în date cu interacțiune AI.
- Crea o întreprindere bazată pe date cu Qlik Sense.
Știința Datelor pe GPU cu NVIDIA RAPIDS
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință și dezvoltatorilor care doresc să folosească RAPIDS pentru a construi fluxuri de date accelerate pe GPU, fluxuri de lucru și vizualizări, aplicând algoritmi de învățare automată, cum ar fi XGBoost, cuML etc.
La finalul acestui training, participanții vor putea:
- Să configureze mediul de dezvoltare necesar pentru a construi modele de date cu NVIDIA RAPIDS.
- Să înțeleagă caracteristicile, componentele și avantajele RAPIDS.
- Să utilizeze GPU-uri pentru a accelera fluxurile de date și analize de la un capăt la altul.
- Să implementeze pregătirea datelor accelerate pe GPU și ETL cu cuDF și Apache Arrow.
- Să învețe cum să execute sarcini de învățare automată cu algoritmii XGBoost și cuML.
- Să construiască vizualizări de date și să execute analize grafice cu cuXfilter și cuGraph.
SMACK Stack pentru Știința Datelor
14 OreAcest training condus de un instructor, live în România (online sau la fața locului) este destinat oamenilor de știință ai datelor care doresc să folosească stiva SMACK pentru a construi platforme de procesare a datelor pentru soluții de big data.
La finalul acestui training, participanții vor putea:
- Să implementeze o arhitectură de pipeline de date pentru procesarea big data.
- Să dezvolte o infrastructură de cluster cu Apache Mesos și Docker.
- Să analizeze date cu Spark și Scala.
- Să gestioneze date nestructurate cu Apache Cassandra.