Cursuri Apache Spark

Cursuri Apache Spark

Programele de instruire live, instruite live Apache Spark demonstrează prin practica de manevră modul în care Spark se încadrează în ecosistemul Big Data și cum se utilizează Spark pentru analiza datelor Programa Apache Spark este disponibilă ca "formare live la fața locului" sau "instruire live la distanță" Training-ul live la fața locului poate fi efectuat la fața locului la sediul clientului România sau în centrele de formare corporativa NobleProg din România Instruirea live la distanță este realizată printr-un desktop interactiv, la distanță NobleProg Furnizorul dvs de formare locală.

Machine Translated

Mărturii

★★★★★
★★★★★

Schita de curs

Title
Durata
Sinoptic
Title
Durata
Sinoptic
21 hours
Sinoptic
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 hours
Sinoptic
Alexio este un sistem de stocare virtual distribuit care deschide un sistem unificat care unifică sisteme de stocare disparate și permite aplicațiilor să interacționeze cu datele la viteza de memorie Este utilizat de companii precum Intel, Baidu și Alibaba În acest training instruit, participanții vor învăța cum să folosească Alexio pentru a lega diferite cadre de calcul cu sistemele de stocare și pentru a gestiona în mod eficient datele de la scară multipeabyte pe măsură ce parcurg crearea unei aplicații cu Alluxio Până la sfârșitul acestui curs, participanții vor putea: Dezvoltați o aplicație cu Alluxio Conectați sistemele mari de date și aplicațiile în timp ce păstrați un spațiu de nume Efectiv extrage valoarea din datele mari în orice format de stocare Îmbunătățiți performanța încărcării de lucru Implementați și gestionați Alluxio independent sau clustered Public Cercetător de date Dezvoltator Administrator de sistem Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
21 hours
Sinoptic
Analiza datelor mari implică procesul de examinare a unor cantități mari de seturi de date variate pentru a descoperi corelații, tipare ascunse și alte informații utile.

Industria sănătății are cantități masive de date medicale și clinice eterogene complexe. Aplicarea analizelor de date mari asupra datelor de sănătate prezintă un potențial imens în obținerea unor perspective pentru îmbunătățirea furnizării asistenței medicale. Cu toate acestea, enormitatea acestor seturi de date prezintă provocări mari în analize și aplicații practice într-un mediu clinic.

În cadrul acestui instruire, instruit în direct (de la distanță), participanții vor învăța cum să efectueze analize de date mari în sănătate, în timp ce parcurg o serie de exerciții practice în laborator live.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Instalați și configurați instrumente de analiză a datelor mari precum Hadoop MapReduce și Spark
- Înțelegeți caracteristicile datelor medicale
- Aplicați tehnici de date mari pentru a trata datele medicale
- Studiați sisteme de date mari și algoritmi în contextul aplicațiilor pentru sănătate

Public

- Dezvoltatori
- Oamenii de știință de date

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice.

Notă

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
28 hours
Sinoptic
Un număr mare de probleme ale lumii reale pot fi descrise în termeni de grafice De exemplu, graficul Web, graficul rețelei sociale, graficul rețelei de tren și graficul de limbă Aceste grafice tind să fie extrem de mari; prelucrarea acestora necesită un set specializat de instrumente și procese, aceste instrumente și procese pot fi denumite Graph Computing (cunoscut și sub numele de Graph Analytics) În acest training instruit, participanții vor învăța despre ofertele de tehnologie și abordările de implementare pentru prelucrarea datelor grafice Scopul este de a identifica obiectele din lumea reală, de caracteristicile și relațiile lor, apoi de a modela aceste relații și de a le procesa ca date folosind o abordare grafică de calcul Începem cu o privire de ansamblu largă și se restrânge instrumentele specifice pe măsură ce trecem printr-o serie de studii de caz, exerciții de manevră și implementări live Până la sfârșitul acestui curs, participanții vor putea: Înțelegeți modul în care datele grafice persistă și traversează Selectați cel mai bun cadru pentru o anumită sarcină (de la baze de date grafice la cadre de procesare în bloc) Implementați Hadoop, Spark, GraphX ​​și Pregel pentru a efectua calcul grafic în mai multe mașini în paralel Vizualizați problemele mari de date realworld din punct de vedere al graficelor, proceselor și traverselor Public Dezvoltatori Formatul cursului Prelegere parte, discuții parțiale, exerciții și practici grele de manevră .
21 hours
Sinoptic
Hortonworks Data Platform (HDP) este o platformă de suport open-source Apache Hadoop care oferă o bază stabilă pentru dezvoltarea de soluții de date mari pe ecosistemul Apache Hadoop .

Acest instruire în direct (la fața locului sau la distanță), condus de instructor, introduce Hortonworks Data Platform (HDP) și parcurge participanții prin implementarea soluției Spark + Hadoop .

Până la sfârșitul acestui antrenament, participanții vor putea:

- Folosiți Hortonworks pentru a rula în mod sigur Hadoop la scară largă.
- Unificați capacitățile de securitate, guvernare și operațiuni ale lui Hadoop cu fluxurile de lucru analitice agile Spark.
- Folosiți Hortonworks pentru a investiga, valida, certifica și susține fiecare componentă dintr-un proiect Spark.
- Procesați diferite tipuri de date, inclusiv structurate, nestructurate, în mișcare și în repaus.

Formatul cursului

- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.

Opțiuni de personalizare a cursului

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
21 hours
Sinoptic
Stream Processing se referă la procesarea în timp real a „datelor în mișcare”, adică efectuarea de calcule pe date așa cum sunt primite. Aceste date sunt citite ca fluxuri continue din surse de date , cum ar fi evenimente de senzori, activitatea utilizatorilor site - ul, tranzacțiile financiare, glisări de card de credit, faceți clic pe fluxuri etc. Stream Processing cadre sunt capabile să citească volume mari de date de intrare și de a oferi perspective valoroase aproape instantaneu.

În cadrul acestui training, instruit în direct (la fața locului sau la distanță), participanții vor învăța cum să configureze și să integreze diferite cadre de Stream Processing fluxurilor cu sistemele de stocare de date mari existente și aplicațiile software și microserviciile aferente.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Instalați și configurați diferite cadre de Stream Processing fluxurilor, cum ar fi Spark Streaming și Kafka Streaming.
- Înțelegeți și selectați cadrul cel mai potrivit pentru job.
- Procesarea datelor în mod continuu, concomitent și într-o manieră record-by-record.
- Integrați soluțiile de Stream Processing fluxurilor cu bazele de date existente, depozite de date, lacuri de date etc.
- Integrați cea mai potrivită bibliotecă de procesare a fluxurilor cu aplicații de întreprindere și microservicii.

Public

- Dezvoltatori
- Arhitecți software

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice

notițe

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
14 hours
Sinoptic
Magellan este un motor de execuție distribuit open-source pentru analize geospatiale pe date mari. Implementat în partea de sus a Apache Spark , extinde Spark SQL și asigură o abstracție relațională pentru analizele geospatiale.

Acest instruire live, condus de instructor, introduce conceptele și abordările pentru implementarea analizei geospaciale și parcurge participanții prin crearea unei aplicații de analiză predictivă folosind Magellan pe Spark.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Întreabă, analizează și alătură seturi de date geospatiale în mod eficient
- Implementați date geospatiale în aplicații de business intelligence și analize predictive
- Utilizați contextul spațial pentru a extinde capabilitățile dispozitivelor mobile, senzorilor, jurnalelor și purtătorilor

Formatul cursului

- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.

Opțiuni de personalizare a cursului

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
21 hours
Sinoptic
Curba de învățare a lui Apache Spark crește încet la început, are nevoie de mult efort pentru a obține primul randament. Acest curs își propune să sară prin prima parte grea. După ce au luat acest curs, participanții vor înțelege elementele de bază ale lui Apache Spark , vor diferenția clar RDD de DataFrame, vor învăța API-ul Python și Scala , vor înțelege executorii și sarcinile etc. De asemenea, urmând cele mai bune practici, acest curs se concentrează puternic pe implementare cloud, baze de date și AWS. De asemenea, studenții vor înțelege diferențele dintre AWS EMR și AWS Glue, unul dintre ultimele servicii Spark ale AWS.

PUBLIC:

Inginer de date, DevOps , Data Scientist
21 hours
Sinoptic
OBIECTIV:

Acest curs va introduce Apache Spark . Elevii vor învăța cum Spark se încadrează în ecosistemul Big Data și cum se utilizează Spark pentru analiza datelor. Cursul acoperă shell-ul Spark pentru analiza interactivă a datelor, Spark internă, Spark API-uri, Spark SQL , Spark streaming și mașină de învățare și graphX.

AUDIENȚĂ:

Dezvoltatori / Analisti de date
21 hours
Sinoptic
Python este un limbaj de programare la nivel înalt, renumit pentru sintaxa și lizibilitatea codurilor sale. Spark este un motor de procesare a datelor utilizat în interogare, analiză și transformare de date mari. PySpark permite utilizatorilor să interfețe Spark cu Python .

În cadrul acestui antrenament, instruit în direct, participanții vor învăța cum să folosească împreună Python și Spark pentru a analiza datele mari pe măsură ce lucrează la exerciții practice.

Până la sfârșitul acestui antrenament, participanții vor putea:

- Aflați cum să utilizați Spark cu Python pentru a analiza Big Data .
- Lucrați la exerciții care imită circumstanțele din lumea reală.
- Utilizați diferite instrumente și tehnici pentru analiza datelor mari utilizând PySpark .

Formatul cursului

- Partea de prelegere, o discuție parțială, exerciții și practici practice
7 hours
Sinoptic
Spark SQL este modulul Apache Spark pentru lucrul cu date structurate și nestructurate. Spark SQL oferă informații despre structura datelor, precum și despre calculul efectuat. Aceste informații pot fi utilizate pentru a realiza optimizări. Două utilizări comune pentru Spark SQL sunt:
- pentru a executa interogări SQL .
- pentru a citi datele dintr-o instalație Hive existentă.

În cadrul acestui training, instruit în direct (la fața locului sau la distanță), participanții vor învăța cum să analizeze diverse tipuri de seturi de date folosind Spark SQL .

Până la sfârșitul acestui antrenament, participanții vor putea:

- Instalați și configurați Spark SQL .
- Efectuați analiza datelor utilizând Spark SQL .
- Seturi de date de interogare în diferite formate.
- Vizualizați datele și rezultatele interogării.

Formatul cursului

- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.

Opțiuni de personalizare a cursului

- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
35 hours
Sinoptic
MLlib este biblioteca Spark de învățare automată (ML). Scopul său este de a face învățarea practică a mașinilor scalabilă și ușoară. Se compune din algoritmi și utilități comune de învățare, inclusiv clasificarea, regresia, gruparea, filtrarea colaborativă, reducerea dimensiunilor, precum și primitivele de optimizare la nivel inferior și API-urile de conducte de nivel superior.

Se împarte în două pachete:

-

spark.mllib conține API original construit pe partea de sus RDDs.

-

spark.ml furnizează API de nivel superior construit pe partea de sus a DataFrames pentru construirea conductelor ML.

Public

Acest curs este adresat inginerilor și dezvoltatorilor care încearcă să utilizeze o mașină de bibliotecă construită pentru Apache Spark

Upcoming Courses

Sfarsit de saptamana Spark Cursuri, Seara Spark Training, Spark Camp, Apache Spark Cu instructor, Sfarsit de saptamana Apache Spark Training, Seara Apache Spark Cursuri, Spark Coaching, Apache Spark Instructor, Spark Trainer, Apache Spark Cursuri, Spark Clase, Spark Pe pagina, Apache Spark curs privat, Spark one on one training

Reduceri pentru cursuri

Newsletter Oferte Cursuri

Respectăm confidențialitatea adresei dvs. de email. Nu vom transmite sau vinde adresa altor părți. Puteți să schimbați preferințele sau să vă dezabonați complet în orice moment.

Câțiva dintre clienții noștri

is growing fast!

We are looking to expand our presence in Romania!

As a Business Development Manager you will:

  • expand business in Romania
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!