Cursuri de pregatire Jupyter pentru echipe de science de date
Jupyter este un IDE interactiv și un mediu de calcul interactiv bazat pe web, cu sursă deschisă.
Acest curs de formare live (online sau la fața locului), condus de un instructor, prezintă ideea de dezvoltare colaborativă în știința datelor și demonstrează cum să se utilizeze Jupyter pentru a urmări și a participa în echipă la "ciclul de viață al unei idei de calcul". Acesta îi conduce pe participanți prin crearea unui proiect de exemplu de știință a datelor bazat pe partea superioară a ecosistemului Jupyter.
La finalul acestui curs de formare, participanții vor fi capabili să:
- Să instaleze și să configureze Jupyter, inclusiv crearea și integrarea unui depozit de echipă pe Git.
- Să utilizeze caracteristicile Jupyter, cum ar fi extensiile, widgeturile interactive, modul multiutilizator și altele pentru a permite colaborarea în cadrul proiectului.
- Să creeze, să partajeze și să organizeze Jupyter Notebooks cu membrii echipei.
- Alegeți din Scala, Python, R, pentru a scrie și executa coduri împotriva sistemelor de date mari, cum ar fi Apache Spark, toate prin intermediul interfeței Jupyter.
Formatul cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Jupyter Notebook suportă peste 40 de limbaje, inclusiv R, Python, Scala, Scala, Julia, etc. Pentru a personaliza acest curs în limba (limbile) pe care o (le) alegeți, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere în Jupyter
- Prezentare generală a Jupyter și a ecosistemului său
- Instalare și configurare
- Configurarea Jupyter pentru colaborarea în echipă
Caracteristici de colaborare
- Utilizarea Git pentru controlul versiunilor
- Extensii și widget-uri interactive
- Modul multiutilizator
Crearea și gestionarea notebook-urilor
- Structura și funcționalitatea notebook-urilor
- Partajarea și organizarea notebook-urilor
- Cele mai bune practici pentru colaborare
Programming cu Jupyter
- Alegerea și utilizarea limbajelor de programare (Python, R, Scala)
- Scrierea și execuția codului
- Integrarea cu sistemele de date mari (Apache Spark)
Caracteristici avansate Jupyter
- Personalizarea mediului Jupyter
- Automatizarea fluxurilor de lucru cu Jupyter
- Explorarea cazurilor avansate de utilizare
Sesiuni practice
- Laboratoare practice
- Proiecte de știință a datelor din lumea reală
- Exerciții de grup și evaluări inter pares
Rezumat și pași următori
Cerințe
- Programming experiență în limbaje precum Python, R, Scala etc.
- O experiență în știința datelor
Audiență
- Echipe de știință a datelor
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Jupyter pentru echipe de science de date - Rezervare
Cursuri de pregatire Jupyter pentru echipe de science de date - Solicitare
Jupyter pentru echipe de science de date - Cerere de consultanta
Cerere de consultanta
Mărturii (1)
Este minunat să aibă cursul personalizat în funcție de zonele cheie pe care le-am marcat în questionarul anterior la curs. Aceasta ne ajută cu adevărat să abordăm întrebările pe care le am cu privire la subiect și să ne aliniem cu obiectivele de învățare.
Winnie Chan - Statistics Canada
Curs - Jupyter for Data Science Teams
Tradus de catre o masina
Cursuri viitoare
Cursuri înrudite
Introducere în Data Science și IA folosind Python
35 oreAcesta este un curs de 5 zile care introduce în cunoștințele despre Inteligența Artificială (AI) și Știința Datelor.
Cursul se bazează pe exemple și exerciții folosind Python.
Ecosistem pentru Cercetătorii de Date
14 oreAceastă instruire live, condusă de un instructor în România (online sau la fața locului) se adresează oamenilor de știință din domeniul datelor care doresc să utilizeze ecosistemul Anaconda pentru a captura, gestiona și implementa pachete și fluxuri de lucru pentru analiza datelor într-o singură platformă.
Până la sfârșitul acestui curs, participanții vor fi capabili să:
- Să instaleze și să configureze componentele și bibliotecile Anaconda.
- Să înțeleagă conceptele, caracteristicile și beneficiile de bază ale Anaconda.
- Să gestioneze pachete, medii și canale utilizând Anaconda Navigator.
- Utilizați Conda, R și pachetele Python pentru știința datelor și învățarea automată.
- Cunoașteți câteva cazuri practice de utilizare și tehnici pentru gestionarea mai multor medii de date.
Big Data Business Intelligence pentru Fournisseurii de Servicii Telecom și Communication
35 oreVizualizare
Furnizorii de servicii (CSP) se confruntă cu presiune pentru a reduce costurile și a maximiza veniturile medii pe utilizator (ARPU), asigurând în același timp o experiență excelentă a clienților, dar volumele de date continuă să crească. Traficul global de date mobile va crește la o rată anuală de creștere combinată (CAGR) de 78% până în 2016, ajungând la 10,8 exabite pe lună.
Între timp, CSP generează volume mari de date, inclusiv înregistrări de detalii de apel (CDR), date de rețea și date despre clienți. Companiile care exploatează pe deplin aceste date câștigă un prag competitiv. Conform unui sondaj recent realizat de The Economist Intelligence Unit, companiile care folosesc deciziile bazate pe date se bucură de o creștere de productivitate de 5-6%. Cu toate acestea, 53% dintre companii folosesc doar jumătate din datele lor valoroase, iar un sfert dintre respondenți a observat că cantități imense de date utile nu sunt folosite. Volumele de date sunt atât de mari încât analiza manuală este imposibilă, iar cele mai multe sisteme software de moștenire nu se pot menține, ceea ce duce la descărcarea sau ignorarea datelor valoroase.
Cu Big Data & Analytics’ software-ul de date mari de mare viteză, scalabil, CSP-urile pot minera toate datele lor pentru o mai bună luare a deciziilor în mai puțin timp. Diferite produse și tehnici oferă o platformă de software fin-to-end pentru colectarea, pregătirea, analizarea și prezentarea de înțelegeri din datele mari. Domeniile de aplicare includ monitorizarea performanței rețelei, detecția fraudelor, detecția clienților și analiza riscurilor de credit. Big Data & Scala produselor de analiză pentru a gestiona terabite de date, dar implementarea unor astfel de instrumente necesită un nou tip de sistem de bază de date bazată pe cloud, cum ar fi Hadoop sau procesorul de calcul paralel cu scară masivă (KPU etc.)
Acest curs lucrează pe Big Data BI pentru Telco acoperă toate domeniile emergente în care CSP-urile investesc pentru creșterea productivității și deschiderea unui nou flux de venituri de afaceri. Cursul va oferi o imagine completă de 360 de grade a Big Data BI în Telco, astfel încât factorii de decizie și managerii pot avea o imagine foarte largă și cuprinzătoare a posibilităților Big Data BI în Telco pentru productivitate și câștiguri de venituri.
Obiectivele cursului
Obiectivul principal al cursului este de a introduce noi Big Data tehnici de inteligență a afacerilor în 4 sectoare de Telecom Business (Marketing/ Vânzări, Operațiuni de rețea, Operațiuni financiare și Relații cu clienții Management). Elevii vor fi invitați să urmeze:
- Introducere la Big Data-ce este 4Vs (volume, viteză, varietate și veracitate) în Big Data- Generație, extracție și management din perspectiva Telco
- Cum se diferențiază analiza de date de moștenire
- In-house justificare a Big Data -Perspectivă Telco
- Introducere la Hadoop Ecosistem- familiaritate cu toate Hadoop instrumente cum ar fi Hive, Pig, SPARC –când și cum sunt utilizate pentru a rezolva problema Big Data
- Cum Big Data este extras pentru a analiza pentru instrumentul de analiză-cum Business Analysis’s pot reduce punctele lor de durere de colectare și de analiză a datelor prin abordarea integrată Hadoop dashboard
- Introducere de bază a analizei Insight, analizei de vizualizare și analizei predictive pentru Telco
- Analiza clienților Churn și Big Data-cum Big Data analiza pot reduce churnul clienților și insatisfacția clienților în studiile de caz Telco
- Analiza eșecurilor de rețea și a eșecurilor de serviciu din meta-data rețelei și IPDR
- Analiza financiară-fraudă, vase și estimarea ROI din vânzări și date operaționale
- Problema achiziției clienților - Marketingul țintă, segmentarea clienților și vânzările transversale din datele de vânzare
- Introducere și rezumat al tuturor produselor analitice Big Data și unde se potrivesc în spațiul analitic Telco
- Conclusie-cum să luați o abordare pas cu pas pentru a introduce Big Data Business Intelligence în organizația dvs.
Publicul țintă
- Operarea rețelei, managerii financiari, managerii CRM și managerii IT de top în biroul Telco CIO.
- Business Analiștii din Telco
- Administratori de birouri / analisti CFO
- Manageri de operare
- Managerii QA
O Introducere Practică în Sciënța Datelor
35 oreParticipanții care finalizează această formare vor dobândi o înțelegere practică, reală a Data Science și a tehnologiilor, metodologiilor și instrumentelor aferente.
Participanții vor avea ocazia să pună în practică aceste cunoștințe prin exerciții practice. Interacțiunea în grup și feedback-ul instructorului constituie o componentă importantă a cursului.
Cursul începe cu o introducere în conceptele elementare ale Data Science, apoi progresează în instrumentele și metodologiile utilizate în Data Science.
Audiență
- Dezvoltatori
- analiști tehnici
- Consultanți IT
Formatul cursului
- Parte prelegere, parte discuție, exerciții și multă practică
Notă
- Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Știința Datelor pentru Analiza Big Data
35 oreDatele mari sunt seturi de date atât de voluminoase și complexe încât softurile tradiționale de aplicații de prelucrare a datelor nu sunt adecvate pentru a le trata. Provocările de date mari includ captarea datelor, stocarea datelor, analiza datelor, căutarea, partajarea, transferul, vizualizarea, interogarea, actualizarea și confidențialitatea informațiilor.
Cunoașterea Șiintelor Datelor esențială pentru profesioniștii din marketing/vânzări
21 oreAcest curs este destinat Profesionistilor din Marketing și Vânzări care intenționează să se aprofundeze în aplicarea științei datelor în Marketing/Vânzări. Cursul oferă o acoperire detaliată a diferitelor tehnici ale științei datelor folosite pentru „upsale”, „cross-sale”, segmentarea pieței, branding și CLV.
Diferența dintre Marketing și Vânzări - Cum se diferentiază vânzările de marketing?
În cuvinte foarte simple, vânzările pot fi definite ca un proces care se concentrează sau ținteste pe indivizi sau grupuri mici. Pe de altă parte, marketingul țintește o grupare mai largă sau publicul general. Marketingul include cercetare (identificarea nevoilor clienților), dezvoltarea produselor (producerea de produse inovatoare) și promovarea produsului (prin publicitate) și crearea unei conștiințe despre produs în rândul consumatorilor. Astfel, marketingul înseamnă generarea de potențiali clienți sau prospetti. Odată ce produsul este lansat pe piață, este sarcina vânzătorului să convingă clientul să cumpere produsul. Vânzările înseamnă convertirea potențialilor clienți sau prospetelor în achiziții și comenzi, în timp ce marketingul are ca scop obiective pe termen lung, iar vânzările se referă la obiective pe termen scurt.
Introducere în Stiintă de Date
35 oreAceastă instruire condusă de instructor (online sau prezentă) este destinată profesionistilor care doresc să înceapă o carieră în știința datelor.
La finalul acestei instruirile, participanții vor putea:
- Instala și configura Python și MySql.
- Înțelege ce este știința datelor și cum poate adăuga valoare practic oricărui business.
- Avea o înțelegere de bază a programării în Python
- Avea cunoștințe despre tehniciile de învățare supervizată și nesupervizată, precum și cum să le implementeze și să interpreteze rezultatele.
Formatul Cursului
- Prezentare interactivă și discuție.
- Mulți exerciții și practică.
- Implementare practică într-un mediu de laborator live.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru aranjamente.
Kaggle
14 oreAceastă formare live, cu instructor, în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să învețe și să își construiască o carieră în Data Science folosind Kaggle.
Până la sfârșitul acestei formări, participanții vor fi capabili să:
- Să învețe despre știința datelor și învățarea automată.
- Să exploreze analiza datelor.
- Să învețe despre Kaggle și modul său de funcționare.
Fundamente MATLAB, Știința Datelor și Generarea Rapoartelor
35 oreÎn prima parte a acestui curs, vom aborda elementele de bază ale MATLAB și funcția sa atât ca limbaj, cât și ca platformă. În această discuție este inclusă o introducere în sintaxa MATLAB, matrice și matrici, vizualizarea datelor, dezvoltarea scripturilor și principiile orientate pe obiect.
În a doua parte, vom demonstra modul de utilizare a MATLAB pentru extragerea datelor, învățarea automată și analiza predictivă. Pentru a oferi participanților o perspectivă clară și practică a abordării și puterii MATLAB, vom face comparații între utilizarea MATLAB și utilizarea altor instrumente, cum ar fi foile de calcul, C, C++ și Visual Basic.
În a treia parte a cursului, participanții învață cum să își eficientizeze activitatea prin automatizarea prelucrării datelor și generării de rapoarte.
Pe parcursul cursului, participanții vor pune în practică ideile învățate prin exerciții practice într-un mediu de laborator. Până la sfârșitul cursului, participanții vor avea o înțelegere aprofundată a capacităților MATLAB și vor putea să le utilizeze pentru a rezolva probleme reale de știința datelor, precum și pentru a-și eficientiza activitatea prin automatizare.
Pe parcursul cursului vor fi efectuate evaluări pentru a măsura progresul.
Formatul cursului
- Cursul include exerciții teoretice și practice, inclusiv discuții de caz, inspectarea codului eșantion și implementarea practică.
Notă
- Sesiunile practice se vor baza pe șabloane de rapoarte de date de probă prestabilite. Dacă aveți cerințe specifice, vă rugăm să ne contactați pentru a aranja.
Machine Learning pentru Data Science cu Python
21 oreAcest training guițit de un instrucțurator în România (online sau pe local) se adresează analistilor de date intermediari, dezvoltatorilor sau aspiranții științifici ai datelor care doresc să aplică tehnici de învățare automatizată în Python pentru a extrage îndrumări, a face previziuni și a automate deciziile bazate pe date.
La sfârșitul acestui curs, participanții vor putea:
- Să înțeleagă și să diferențieze principalele paradigme ale învățării automatizate.
- Să exploreze tehnici de preprocesare a datelor și metricile de evaluare a modelului.
- Să aplique algoritmi de învățare automatizată pentru a rezolva probleme reale cu date.
- Să folosească bibliotecile Python și notebook-urile Jupyter pentru dezvoltarea practică.
- Să construiască modele pentru previziuni, clasificare, recomandări și grupare.
Accelerarea fluxurilor de lucru Python Pandas cu Modin
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să utilizeze Modin pentru a construi și implementa calcule paralele cu Pandas pentru o analiză mai rapidă a datelor.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să configureze mediul necesar pentru a începe să dezvolte fluxuri de lucru Pandas la scară largă cu Modin.
- Să înțeleagă caracteristicile, arhitectura și avantajele Modin.
- Să cunoască diferențele dintre Modin, Dask și Ray.
- Efectuați operații Pandas mai rapid cu Modin.
- Implementați întregul API și funcțiile Pandas.
Programare Python pentru finanțe
35 orePython este un limbaj de programare care a câștigat o popularitate enormă în industria financiară. Adoptat de cele mai mari bănci de investiții și fonduri hedge, acesta se folosește pentru construirea unei gamă largi de aplicații financiare, de la programe de tranzacționare corelativ până la sisteme de gestionare a riscurilor.
În această instruire guvernată de instructor, participanții vor învăța cum să folosească Python pentru dezvoltarea aplicațiilor practice care rezolvă o serie de probleme financiare specifice.
La sfârșitul acestei instruiri, participanții vor putea:
- Înțelege fundamentele limbajului de programare Python
- Descărca, instala și menține cele mai bune unelte de dezvoltare pentru crearea aplicațiilor financiare în Python
- Selecta și utiliza cele mai potrivite pachete Python și tehnici de programare pentru a organiza, vizualiza și analiza datele financiare din diverse surse (CSV, Excel, baze de date, web, etc.)
- Construi aplicații care rezolvă probleme legate de alocația activelor, analiza riscurilor, performanța investițiilor și multe altele
- Soluționa, integra, implementa și optimiza o aplicație Python
Audiență
- Dezvoltatori
- Analiști
- Quants (analiști cu un accent pe metode quantitative)
Formatul cursului
- Poartă parte de prelegeri, discuții, exerciții și practică intensivă
Note
- Această instruire vizează oferirea de soluții pentru unele dintre problemele principale cu care se confruntă profesioniștii din finanțe. Cu toate acestea, dacă aveți un anumit subiect, instrument sau tehnică pe care doriți să-l adăugați sau elaborați mai mult, vă rugăm să ne contactați pentru a organiza.
Python în Cibernetică și Analiza Datelor
35 oreCursul de instruire va ajuta participanții să se pregătească pentru Dezvoltarea Aplicațiilor Web folosind Programarea Python cu Analiza Datelor. Acest tip de vizualizare a datelor este un instrument excelent pentru Managementul de Top în luarea deciziilor.
Qlik Sense pentru Cercetarea Datelor
14 oreAceastă instruire condusă de instructor (online sau la fața locului) se adresează analiștilor de date și dezvoltatorilor web care doresc să dezvolte modele asociative în Qlik Sense.
La finalul acestei instruirile, participanții vor putea:
- Aplica Qlik Sense în știința datelor.
- Utiliza și naviga prin interfața Qlik Sense.
- Construi o forță de muncă literată în date cu interacțiune AI.
- Crea o întreprindere bazată pe date folosind Qlik Sense.
Science de Date cu GPU folosind NVIDIA RAPIDS
14 oreAceastă instruire condusă de instructor (online sau pe loc) este adresată științistilor de date și dezvoltatorilor care doresc să folosească RAPIDS pentru a construi pipeleini, fluxuri de lucru și vizualizări de date cu accelerare GPU, aplicând algoritmi de învățare automată precum XGBoost, cuML, etc.
La sfârșitul acestei instruiri, participanții vor putea:
- Configura mediul de dezvoltare necesar pentru a construi modele de date cu NVIDIA RAPIDS.
- Înțelege funcțiile, componentele și avantajele RAPIDS.
- Aprofita de GPU-uri pentru a accelera pipeleini de date și analiză end-to-end.
- Implementa prepararea datelor și ETL cu accelerare GPU folosind cuDF și Apache Arrow.
- Învață cum să efectueze sarcini de învățare automată folosind algoritmi XGBoost și cuML.
- Construiți vizualizări de date și executați analiza grafică cu cuXfilter și cuGraph.