Cursuri de pregatire Jupyter pentru echipe de science de date
Jupyter este un IDE interactiv și un mediu de calcul interactiv bazat pe web, cu sursă deschisă.
Acest curs de formare live (online sau la fața locului), condus de un instructor, prezintă ideea de dezvoltare colaborativă în știința datelor și demonstrează cum să se utilizeze Jupyter pentru a urmări și a participa în echipă la "ciclul de viață al unei idei de calcul". Acesta îi conduce pe participanți prin crearea unui proiect de exemplu de știință a datelor bazat pe partea superioară a ecosistemului Jupyter.
La finalul acestui curs de formare, participanții vor fi capabili să:
- Să instaleze și să configureze Jupyter, inclusiv crearea și integrarea unui depozit de echipă pe Git.
- Să utilizeze caracteristicile Jupyter, cum ar fi extensiile, widgeturile interactive, modul multiutilizator și altele pentru a permite colaborarea în cadrul proiectului.
- Să creeze, să partajeze și să organizeze Jupyter Notebooks cu membrii echipei.
- Alegeți din Scala, Python, R, pentru a scrie și executa coduri împotriva sistemelor de date mari, cum ar fi Apache Spark, toate prin intermediul interfeței Jupyter.
Formatul cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Jupyter Notebook suportă peste 40 de limbaje, inclusiv R, Python, Scala, Scala, Julia, etc. Pentru a personaliza acest curs în limba (limbile) pe care o (le) alegeți, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere în Jupyter
- Prezentare generală a Jupyter și a ecosistemului său
- Instalare și configurare
- Configurarea Jupyter pentru colaborarea în echipă
Caracteristici de colaborare
- Utilizarea Git pentru controlul versiunilor
- Extensii și widget-uri interactive
- Modul multiutilizator
Crearea și gestionarea notebook-urilor
- Structura și funcționalitatea notebook-urilor
- Partajarea și organizarea notebook-urilor
- Cele mai bune practici pentru colaborare
Programming cu Jupyter
- Alegerea și utilizarea limbajelor de programare (Python, R, Scala)
- Scrierea și execuția codului
- Integrarea cu sistemele de date mari (Apache Spark)
Caracteristici avansate Jupyter
- Personalizarea mediului Jupyter
- Automatizarea fluxurilor de lucru cu Jupyter
- Explorarea cazurilor avansate de utilizare
Sesiuni practice
- Laboratoare practice
- Proiecte de știință a datelor din lumea reală
- Exerciții de grup și evaluări inter pares
Rezumat și pași următori
Cerințe
- Programming experiență în limbaje precum Python, R, Scala etc.
- O experiență în știința datelor
Audiență
- Echipe de știință a datelor
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Jupyter pentru echipe de science de date - Rezervare
Cursuri de pregatire Jupyter pentru echipe de science de date - Solicitare
Jupyter pentru echipe de science de date - Cerere de consultanta
Cerere de consultanta
Mărturii (1)
Este foarte bine că cursul a fost personalizat pentru principalele domenii pe care le-am evidențiat în chestionarul pre-curs. Acest lucru ajută cu adevărat la abordarea întrebărilor pe care le am în privința materiei și la alinierea cu obiectivele mele de învățare.
Winnie Chan - Statistics Canada
Curs - Jupyter for Data Science Teams
Tradus de catre o masina
Cursuri viitoare
Cursuri înrudite
Introducere în Data Science și IA folosind Python
35 oreAcesta este un curs de 5 zile care introduce în cunoștințele despre Inteligența Artificială (AI) și Știința Datelor.
Cursul se bazează pe exemple și exerciții folosind Python.
Ecosistem pentru Cercetătorii de Date
14 oreAceastă instruire live, condusă de un instructor în România (online sau la fața locului) se adresează oamenilor de știință din domeniul datelor care doresc să utilizeze ecosistemul Anaconda pentru a captura, gestiona și implementa pachete și fluxuri de lucru pentru analiza datelor într-o singură platformă.
Până la sfârșitul acestui curs, participanții vor fi capabili să:
- Să instaleze și să configureze componentele și bibliotecile Anaconda.
- Să înțeleagă conceptele, caracteristicile și beneficiile de bază ale Anaconda.
- Să gestioneze pachete, medii și canale utilizând Anaconda Navigator.
- Utilizați Conda, R și pachetele Python pentru știința datelor și învățarea automată.
- Cunoașteți câteva cazuri practice de utilizare și tehnici pentru gestionarea mai multor medii de date.
O Introducere Practică în Știința Datelor
35 oreParticipanții care finalizează această instruire vor obține o înțelegere practică, cu bază în lumea reală a Științei Datelor și al tehnologiilor, metodologielor și uneltele sale asociate.
Participanții vor avea oportunitatea de a pune această cunoaștere în practică prin exerciții practice. Interacțiunea grupului și feedback-ul instrucționar reprezintă un component important al cursului.
Cursul începe cu o introducere la conceptele elementare ale Științei Datelor, apoi trece la instrumente și metodologii utilizate în Știința Datelor.
Audiență
- Dezvoltatori
- Analisti tehnici
- Consultanți IT
Formatul Cursului
- O parte prezentare, o parte discuție, exerciții și practică intensivă
Notă
- Pentru a solicita un curs personalizat, vă rugăm să ne contactați pentru aranjamente.
Science Data pentru Analiza Big Data
35 oreBig data se referă la mulțimi de date care sunt atât de mari și complexe încât aplicațiile tradiționale de procesare a datelor nu sunt suficiente pentru a le gestiona. Provocările big data includ capturarea, stocarea, analiza, căutarea, împărtășirea, transferul, vizualizarea, interogarea, actualizarea și protejarea confidențialității datelor.
Cunoașterea Șiintelor Datelor esențială pentru profesioniștii din marketing/vânzări
21 oreAcest curs este destinat Profesionistilor din Marketing și Vânzări care intenționează să se aprofundeze în aplicarea științei datelor în Marketing/Vânzări. Cursul oferă o acoperire detaliată a diferitelor tehnici ale științei datelor folosite pentru „upsale”, „cross-sale”, segmentarea pieței, branding și CLV.
Diferența dintre Marketing și Vânzări - Cum se diferentiază vânzările de marketing?
În cuvinte foarte simple, vânzările pot fi definite ca un proces care se concentrează sau ținteste pe indivizi sau grupuri mici. Pe de altă parte, marketingul țintește o grupare mai largă sau publicul general. Marketingul include cercetare (identificarea nevoilor clienților), dezvoltarea produselor (producerea de produse inovatoare) și promovarea produsului (prin publicitate) și crearea unei conștiințe despre produs în rândul consumatorilor. Astfel, marketingul înseamnă generarea de potențiali clienți sau prospetti. Odată ce produsul este lansat pe piață, este sarcina vânzătorului să convingă clientul să cumpere produsul. Vânzările înseamnă convertirea potențialilor clienți sau prospetelor în achiziții și comenzi, în timp ce marketingul are ca scop obiective pe termen lung, iar vânzările se referă la obiective pe termen scurt.
Introducere în Stiintă de Date
35 oreAceastă instruire condusă de instructor (online sau prezentă) este destinată profesionistilor care doresc să înceapă o carieră în știința datelor.
La finalul acestei instruirile, participanții vor putea:
- Instala și configura Python și MySql.
- Înțelege ce este știința datelor și cum poate adăuga valoare practic oricărui business.
- Avea o înțelegere de bază a programării în Python
- Avea cunoștințe despre tehniciile de învățare supervizată și nesupervizată, precum și cum să le implementeze și să interpreteze rezultatele.
Formatul Cursului
- Prezentare interactivă și discuție.
- Mulți exerciții și practică.
- Implementare practică într-un mediu de laborator live.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru aranjamente.
Kaggle
14 oreAceastă formare live, cu instructor, în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să învețe și să își construiască o carieră în Data Science folosind Kaggle.
Până la sfârșitul acestei formări, participanții vor fi capabili să:
- Să învețe despre știința datelor și învățarea automată.
- Să exploreze analiza datelor.
- Să învețe despre Kaggle și modul său de funcționare.
Fundamente MATLAB, Știința Datelor și Generarea Rapoartelor
35 oreÎn prima parte a acestui curs, vom aborda elementele de bază ale MATLAB și funcția sa atât ca limbaj, cât și ca platformă. În această discuție este inclusă o introducere în sintaxa MATLAB, matrice și matrici, vizualizarea datelor, dezvoltarea scripturilor și principiile orientate pe obiect.
În a doua parte, vom demonstra modul de utilizare a MATLAB pentru extragerea datelor, învățarea automată și analiza predictivă. Pentru a oferi participanților o perspectivă clară și practică a abordării și puterii MATLAB, vom face comparații între utilizarea MATLAB și utilizarea altor instrumente, cum ar fi foile de calcul, C, C++ și Visual Basic.
În a treia parte a cursului, participanții învață cum să își eficientizeze activitatea prin automatizarea prelucrării datelor și generării de rapoarte.
Pe parcursul cursului, participanții vor pune în practică ideile învățate prin exerciții practice într-un mediu de laborator. Până la sfârșitul cursului, participanții vor avea o înțelegere aprofundată a capacităților MATLAB și vor putea să le utilizeze pentru a rezolva probleme reale de știința datelor, precum și pentru a-și eficientiza activitatea prin automatizare.
Pe parcursul cursului vor fi efectuate evaluări pentru a măsura progresul.
Formatul cursului
- Cursul include exerciții teoretice și practice, inclusiv discuții de caz, inspectarea codului eșantion și implementarea practică.
Notă
- Sesiunile practice se vor baza pe șabloane de rapoarte de date de probă prestabilite. Dacă aveți cerințe specifice, vă rugăm să ne contactați pentru a aranja.
Machine Learning pentru Data Science cu Python
21 oreAcest training guițit de un instrucțurator în România (online sau pe local) se adresează analistilor de date intermediari, dezvoltatorilor sau aspiranții științifici ai datelor care doresc să aplică tehnici de învățare automatizată în Python pentru a extrage îndrumări, a face previziuni și a automate deciziile bazate pe date.
La sfârșitul acestui curs, participanții vor putea:
- Să înțeleagă și să diferențieze principalele paradigme ale învățării automatizate.
- Să exploreze tehnici de preprocesare a datelor și metricile de evaluare a modelului.
- Să aplique algoritmi de învățare automatizată pentru a rezolva probleme reale cu date.
- Să folosească bibliotecile Python și notebook-urile Jupyter pentru dezvoltarea practică.
- Să construiască modele pentru previziuni, clasificare, recomandări și grupare.
Accelerarea fluxurilor de lucru Python Pandas cu Modin
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să utilizeze Modin pentru a construi și implementa calcule paralele cu Pandas pentru o analiză mai rapidă a datelor.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să configureze mediul necesar pentru a începe să dezvolte fluxuri de lucru Pandas la scară largă cu Modin.
- Să înțeleagă caracteristicile, arhitectura și avantajele Modin.
- Să cunoască diferențele dintre Modin, Dask și Ray.
- Efectuați operații Pandas mai rapid cu Modin.
- Implementați întregul API și funcțiile Pandas.
Programare Python pentru finanțe
35 orePython este un limbaj de programare care a câștigat o popularitate enormă în industria financiară. Adoptat de cele mai mari bănci de investiții și fonduri hedge, acesta se folosește pentru construirea unei gamă largi de aplicații financiare, de la programe de tranzacționare corelativ până la sisteme de gestionare a riscurilor.
În această instruire guvernată de instructor, participanții vor învăța cum să folosească Python pentru dezvoltarea aplicațiilor practice care rezolvă o serie de probleme financiare specifice.
La sfârșitul acestei instruiri, participanții vor putea:
- Înțelege fundamentele limbajului de programare Python
- Descărca, instala și menține cele mai bune unelte de dezvoltare pentru crearea aplicațiilor financiare în Python
- Selecta și utiliza cele mai potrivite pachete Python și tehnici de programare pentru a organiza, vizualiza și analiza datele financiare din diverse surse (CSV, Excel, baze de date, web, etc.)
- Construi aplicații care rezolvă probleme legate de alocația activelor, analiza riscurilor, performanța investițiilor și multe altele
- Soluționa, integra, implementa și optimiza o aplicație Python
Audiență
- Dezvoltatori
- Analiști
- Quants (analiști cu un accent pe metode quantitative)
Formatul cursului
- Poartă parte de prelegeri, discuții, exerciții și practică intensivă
Note
- Această instruire vizează oferirea de soluții pentru unele dintre problemele principale cu care se confruntă profesioniștii din finanțe. Cu toate acestea, dacă aveți un anumit subiect, instrument sau tehnică pe care doriți să-l adăugați sau elaborați mai mult, vă rugăm să ne contactați pentru a organiza.
Python în Știința Datelor
35 oreCursul de formare va ajuta participanții să se pregătească pentru Dezvoltarea Aplicațiilor Web folosind Programarea Python cu Analiza Datelor. Astfel, vizualizarea datelor este un instrument excelent pentru Managementul de Top în luarea deciziilor.
Qlik Sense pentru Cercetarea Datelor
14 oreAceastă instruire condusă de instructor (online sau la fața locului) se adresează analiștilor de date și dezvoltatorilor web care doresc să dezvolte modele asociative în Qlik Sense.
La finalul acestei instruirile, participanții vor putea:
- Aplica Qlik Sense în știința datelor.
- Utiliza și naviga prin interfața Qlik Sense.
- Construi o forță de muncă literată în date cu interacțiune AI.
- Crea o întreprindere bazată pe date folosind Qlik Sense.
Science de Date cu GPU folosind NVIDIA RAPIDS
14 oreAceastă instruire condusă de instructor (online sau pe loc) este adresată științistilor de date și dezvoltatorilor care doresc să folosească RAPIDS pentru a construi pipeleini, fluxuri de lucru și vizualizări de date cu accelerare GPU, aplicând algoritmi de învățare automată precum XGBoost, cuML, etc.
La sfârșitul acestei instruiri, participanții vor putea:
- Configura mediul de dezvoltare necesar pentru a construi modele de date cu NVIDIA RAPIDS.
- Înțelege funcțiile, componentele și avantajele RAPIDS.
- Aprofita de GPU-uri pentru a accelera pipeleini de date și analiză end-to-end.
- Implementa prepararea datelor și ETL cu accelerare GPU folosind cuDF și Apache Arrow.
- Învață cum să efectueze sarcini de învățare automată folosind algoritmi XGBoost și cuML.
- Construiți vizualizări de date și executați analiza grafică cu cuXfilter și cuGraph.
SMACK Stack pentru Cercetarea Datelor
14 oreAceastă instruire condusă de un instructor, în direct (online sau prezent) se adresează științistilor de date care doresc să folosească stiva SMACK pentru a construi platforme de procesare a datelor pentru soluții cu date la scară largă.
La finalul acestei instruirile, participanții vor putea:
- Implementa o arhitectură de pipeline de date pentru procesarea datelor la scară largă.
- Dezvolta infrastructura unui cluster cu Apache Mesos și Docker.
- Analiza datele cu Spark și Scala.
- Gestioneaza datele nestructurate cu Apache Cassandra.