Cursuri de pregatire Jupyter pentru echipe de știința datelor
Jupyter este un mediu de dezvoltare interactiv, bazat pe web, open-source.
Acest training condus de un instructor, live (online sau la fața locului) introduce ideea dezvoltării collaborative în știința datelor și demonstrează cum să folosiți Jupyter pentru a urmări și a participa ca echipă la „ciclu de viață al unei idei computationale”. Acest training ghidează participanții prin crearea unui proiect exemplu de știința datelor bazat pe ecosistemul Jupyter.
La finalul acestui training, participanții vor putea:
- Instala și configura Jupyter, inclusiv crearea și integrarea unui depozit de echipă pe Git.
- Folosi funcționalități Jupyter precum extensii, widget-uri interactive, modul multiutilizator și multe altele pentru a facilita colaborarea la proiecte.
- Crea, partaja și organiza Jupyter Notebooks cu membrii echipei.
- Alege între Scala, Python, R pentru a scrie și executa cod pe sisteme de date mari precum Apache Spark, toate prin interfața Jupyter.
Formatul cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Jupyter Notebook suportă peste 40 de limbaje, inclusiv R, Python, Scala, Julia, etc. Pentru a personaliza acest curs la limbajele dumneavoastră preferate, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere în Jupyter
- Prezentare generală a Jupyter și a ecosistemului său
- Instalare și configurare
- Configurarea Jupyter pentru colaborare în echipă
Funcționalități collaborative
- Folosirea Git pentru controlul versiunilor
- Extensii și widget-uri interactive
- Modul multiutilizator
Crearea și gestionarea Notebooks
- Structura și funcționalitatea Notebooks
- Partajarea și organizarea Notebooks
- Bune practici pentru colaborare
Programare cu Jupyter
- Alegerea și utilizarea limbajelor de programare (Python, R, Scala)
- Scrierea și executarea codului
- Integrarea cu sisteme de date mari (Apache Spark)
Funcționalități avansate ale Jupyter
- Personalizarea mediului Jupyter
- Automatizarea fluxurilor de lucru cu Jupyter
- Explorarea cazurilor de utilizare avansate
Sesiuni practice
- Laboratoare practice
- Proiecte de știința datelor din lumea reală
- Exerciții de grup și evaluări între colegi
Rezumat și pași următori
Cerințe
- Experiență în programare în limbaje precum Python, R, Scala, etc.
- Cunoștințe în domeniul științei datelor
Public țintă
- Echipe de știința datelor
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Jupyter pentru echipe de știința datelor - Rezervare
Cursuri de pregatire Jupyter pentru echipe de știința datelor - Solicitare
Jupyter pentru echipe de știința datelor - Cerere de consultanta
Mărturii (1)
Este foarte bine că cursul a fost personalizat pentru principalele domenii pe care le-am evidențiat în chestionarul pre-curs. Acest lucru ajută cu adevărat la abordarea întrebărilor pe care le am în privința materiei și la alinierea cu obiectivele mele de învățare.
Winnie Chan - Statistics Canada
Curs - Jupyter for Data Science Teams
Tradus de catre o masina
Cursuri viitoare
Cursuri înrudite
Introducere în Știința Datelor și AI folosind Python
35 OreAcesta este un curs introductiv de 5 zile în Știința Datelor și Inteligența Artificială (AI).
Cursul este prezentat cu exemple și exerciții folosind Python.
Apache Airflow pentru Știința Datelor: Automatizarea Pipeline-urilor de Învățare Automată
21 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat participanților de nivel intermediar care doresc să automatizeze și să gestioneze fluxurile de lucru de învățare automată, inclusiv antrenarea, validarea și implementarea modelelor folosind Apache Airflow.
La finalul acestui training, participanții vor putea:
- Să configureze Apache Airflow pentru orchestrarea fluxurilor de lucru de învățare automată.
- Să automatizeze sarcinile de preprocesare a datelor, antrenare a modelelor și validare.
- Să integreze Airflow cu cadre și instrumente de învățare automată.
- Să implementeze modele de învățare automată folosind pipeline-uri automate.
- Să monitorizeze și să optimizeze fluxurile de lucru de învățare automată în producție.
Ecosistemul Anaconda pentru Oamenii de Știință a Datelor
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință a datelor care doresc să utilizeze ecosistemul Anaconda pentru a captura, gestiona și implementa pachete și fluxuri de lucru de analiză a datelor într-o singură platformă.
La finalul acestui training, participanții vor putea:
- Instala și configura componentele și bibliotecile Anaconda.
- Înțelege conceptele de bază, caracteristicile și beneficiile Anaconda.
- Gestiona pachete, medii și canale folosind Anaconda Navigator.
- Utiliza pachete Conda, R și Python pentru știința datelor și învățarea automată.
- Să cunoască câteva cazuri practice și tehnici pentru gestionarea mai multor medii de date.
AWS Cloud9 pentru Știința Datelor
28 OreAceastă formare condusă de un instructor, live în România (online sau la fața locului) este destinată cercetătorilor de date și analiștilor de nivel intermediar care doresc să folosească AWS Cloud9 pentru fluxuri de lucru eficiente în știința datelor.
La finalul acestei formări, participanții vor putea:
- Să configureze un mediu de știința datelor în AWS Cloud9.
- Să efectueze analize de date folosind Python, R și Jupyter Notebook în Cloud9.
- Să integreze AWS Cloud9 cu serviciile de date AWS precum S3, RDS și Redshift.
- Să utilizeze AWS Cloud9 pentru dezvoltarea și implementarea modelelor de învățare automată.
- Să optimizeze fluxurile de lucru bazate pe cloud pentru analiza și procesarea datelor.
Introducere în Google Colab pentru Știința Datelor
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat începătorilor în domeniul științei datelor și profesioniștilor IT care doresc să învețe elementele de bază ale științei datelor folosind Google Colab.
La finalul acestui training, participanții vor fi capabili să:
- Să configureze și să navigheze în Google Colab.
- Să scrie și să execute cod Python de bază.
- Să importe și să manipuleze seturi de date.
- Să creeze vizualizări folosind biblioteci Python.
O introducere practică în Știința Datelor
35 OreParticipanții care finalizează acest training vor dobândi o înțelegere practică și aplicabilă în lumea reală a Științei Datelor, precum și a tehnologiilor, metodelor și instrumentelor aferente.
Participanții vor avea ocazia să pună în practică aceste cunoștințe prin exerciții practice. Interacțiunea în grup și feedback-ul instructorului constituie o componentă importantă a cursului.
Cursul începe cu o introducere în conceptele de bază ale Științei Datelor, după care progresează către instrumentele și metodele utilizate în domeniu.
Public țintă
- Dezvoltatori
- Analiști tehnici
- Consultanți IT
Formatul cursului
- Partea teoretică, discuții, exerciții și practică intensivă
Notă
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Știința Datelor pentru Analiza Big Data
35 OreBig data se referă la seturi de date atât de voluminoase și complexe încât software-urile tradiționale de procesare a datelor sunt inadecvate pentru a le gestiona. Provocările big data includ capturarea datelor, stocarea datelor, analiza datelor, căutarea, partajarea, transferul, vizualizarea, interogarea, actualizarea și confidențialitatea informațiilor.
Știința datelor esențială pentru profesioniști în Marketing/Vânzări
21 Ore
Acest curs este destinat profesioniștilor în Marketing și Vânzări care doresc să aprofundeze aplicarea științei datelor în Marketing/Vânzări. Cursul oferă
o acoperire detaliată a diferitelor tehnici de știință a datelor utilizate pentru „upsale”, „cross-sale”, segmentarea pieței, branding și CLV.
Diferența dintre Marketing și Vânzări - Cum diferă vânzările de marketing?
În termeni simpli, vânzările pot fi definite ca un proces care se concentrează sau se adresează indivizilor sau unor grupuri mici. Pe de altă parte, marketingul se adresează unui grup mai larg sau publicului general. Marketingul include cercetarea (identificarea nevoilor clientului), dezvoltarea produselor (producerea de produse inovatoare) și promovarea produsului (prin reclame) și crearea de conștientizare despre produs în rândul consumatorilor. Astfel, marketingul înseamnă generarea de lead-uri sau prospecte. Odată ce produsul este lansat pe piață, este sarcina vânzătorului să îl convingă pe client să cumpere produsul. Vânzările înseamnă transformarea lead-urilor sau prospectelor în achiziții și comenzi, în timp ce marketingul este orientat către obiective pe termen lung, iar vânzările se referă la obiective pe termen scurt.
Introducere în Știința Datelor
35 OreAcest training condus de un instructor, live (online sau la fața locului), este destinat profesioniștilor care doresc să înceapă o carieră în Știința Datelor.
La finalul acestui training, participanții vor putea:
- Să instaleze și să configureze Python și MySql.
- Să înțeleagă ce este Știința Datelor și cum poate adăuga valoare aproape oricărei afaceri.
- Să învețe elementele de bază ale programării în Python.
- Să învețe tehnici de învățare automată supervizată și nesupervizată, și cum să le implementeze și să interpreteze rezultatele.
Formatul Cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Kaggle
14 OreAcest training condus de un instructor, live în România (online sau la fața locului) este destinat specialiștilor în știința datelor și dezvoltatorilor care doresc să învețe și să-și construiască o carieră în Știința Datelor folosind Kaggle.
La finalul acestui training, participanții vor putea:
- Să învețe despre știința datelor și învățarea automată.
- Să exploreze analiza datelor.
- Să învețe despre Kaggle și cum funcționează.
Știința Datelor cu Platforma KNIME Analytics
21 OrePlatforma KNIME Analytics este o opțiune open source de top pentru inovația bazată pe date, ajutându-vă să descoperiți potențialul ascuns în datele dumneavoastră, să extrageți noi perspective sau să preziceți viitorul. Cu peste 1000 de module, sute de exemple gata de rulat, o gamă cuprinzătoare de instrumente integrate și cea mai variată selecție de algoritmi avansați disponibili, Platforma KNIME Analytics este cutia de instrumente perfectă pentru orice specialist în date și analist de afaceri.
Acest curs pentru Platforma KNIME Analytics este o oportunitate ideală pentru începători, utilizatori avansați și experți KNIME să fie introduși în KNIME, să învețe cum să îl folosească mai eficient și cum să creeze rapoarte clare și cuprinzătoare bazate pe fluxuri de lucru KNIME.
Această instruire condusă de un instructor, live (online sau la fața locului), este destinată profesioniștilor din domeniul datelor care doresc să folosească KNIME pentru a rezolva nevoi complexe de afaceri.
Este destinată publicului care nu cunoaște programarea și intenționează să folosească instrumente de ultimă oră pentru a implementa scenarii de analiză.
La sfârșitul acestei instruiri, participanții vor putea:
- Instala și configura KNIME.
- Construi scenarii de Știința Datelor.
- Antrena, testa și valida modele.
- Implementa lanțul de valoare de la cap la capăt al modelelor de știință a datelor.
Formatul Cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o instruire personalizată pentru acest curs sau pentru a afla mai multe despre acest program, vă rugăm să ne contactați pentru a aranja.
Fundamentele MATLAB, Știința Datelor și Generarea de Rapoarte
35 OreÎn prima parte a acestui training, acoperim elementele de bază ale MATLAB și funcția sa atât ca limbaj, cât și ca platformă. Această discuție include o introducere în sintaxa MATLAB, array-uri și matrice, vizualizarea datelor, dezvoltarea de scripturi și principiile de programare orientată pe obiecte.
În a doua parte, demonstrăm cum să folosim MATLAB pentru data mining, învățarea automată și analiza predictivă. Pentru a oferi participanților o perspectivă clară și practică asupra abordării și puterii MATLAB, facem comparații între utilizarea MATLAB și a altor instrumente precum foile de calcul, C, C++ și Visual Basic.
În a treia parte a trainingului, participanții învață cum să-și streamlineze munca prin automatizarea procesării datelor și generarea de rapoarte.
De-a lungul cursului, participanții vor pune în practică conceptele învățate prin exerciții practice într-un mediu de laborator. La finalul trainingului, participanții vor avea o înțelegere profundă a capacităților MATLAB și vor putea să-l folosească pentru a rezolva probleme reale din domeniul științei datelor, precum și pentru a-și eficientiza munca prin automatizare.
Evaluări vor fi efectuate pe parcursul cursului pentru a măsura progresul.
Formatul Cursului
- Cursul include exerciții teoretice și practice, inclusiv discuții de caz, inspecția codului de exemplu și implementarea practică.
Notă
- Sesiunile de practică se vor baza pe șabloane de rapoarte cu date predefinite. Dacă aveți cerințe specifice, vă rugăm să ne contactați pentru a aranja.
Învățare Automată pentru Știința Datelor cu Python
21 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat analiștilor de date de nivel intermediar, dezvoltatorilor sau viitorilor specialiști în știința datelor care doresc să aplice tehnici de învățare automată în Python pentru a extrage informații, a face predicții și a automatiza deciziile bazate pe date.
La finalul acestui curs, participanții vor putea:
- Să înțeleagă și să diferențieze paradigmele cheie ale învățării automate.
- Să exploreze tehnici de preprocesare a datelor și metrici de evaluare a modelelor.
- Să aplice algoritmi de învățare automată pentru a rezolva probleme reale din domeniul datelor.
- Să utilizeze biblioteci Python și Jupyter Notebooks pentru dezvoltare practică.
- Să construiască modele pentru predicție, clasificare, recomandare și clustering.
Accelerarea Fluxurilor de Lucru Python Pandas cu Modin
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință și dezvoltatorilor care doresc să folosească Modin pentru a construi și implementa calcule paralele cu Pandas pentru o analiză de date mai rapidă.
La sfârșitul acestui training, participanții vor putea:
- Să configureze mediul necesar pentru a începe dezvoltarea fluxurilor de lucru Pandas la scară largă cu Modin.
- Să înțeleagă caracteristicile, arhitectura și avantajele Modin.
- Să cunoască diferențele dintre Modin, Dask și Ray.
- Să efectueze operațiuni Pandas mai rapid cu Modin.
- Să implementeze întreaga API și funcții Pandas.
Știința Datelor pe GPU cu NVIDIA RAPIDS
14 OreAcest training condus de un instructor, live în România (online sau la fața locului), este destinat oamenilor de știință și dezvoltatorilor care doresc să folosească RAPIDS pentru a construi fluxuri de date accelerate pe GPU, fluxuri de lucru și vizualizări, aplicând algoritmi de învățare automată, cum ar fi XGBoost, cuML etc.
La finalul acestui training, participanții vor putea:
- Să configureze mediul de dezvoltare necesar pentru a construi modele de date cu NVIDIA RAPIDS.
- Să înțeleagă caracteristicile, componentele și avantajele RAPIDS.
- Să utilizeze GPU-uri pentru a accelera fluxurile de date și analize de la un capăt la altul.
- Să implementeze pregătirea datelor accelerate pe GPU și ETL cu cuDF și Apache Arrow.
- Să învețe cum să execute sarcini de învățare automată cu algoritmii XGBoost și cuML.
- Să construiască vizualizări de date și să execute analize grafice cu cuXfilter și cuGraph.