Schița de curs

Introducere în Apache Spark

  • Rolul lui Spark în procesarea datelor mari
  • Arhitectura Spark și componentele sale

Configurarea Apache Spark

  • Cerințe hardware și software
  • Proceduri de instalare pentru modurile standalone și cluster
  • Cele mai bune practici de configurare pentru administratorii de sistem

Administrarea clusterelor Spark

  • Instrumente și tehnici de administrare a clusterelor
  • Monitorizarea aplicațiilor Spark și a resurselor clusterului
  • Configurații de securitate și gestionarea utilizatorilor

Reglarea și optimizarea performanței

  • Alocarea și programarea resurselor
  • Reglarea Spark pentru o performanță optimă
  • Identificarea și rezolvarea blocajelor comune

Depanarea și rezolvarea problemelor

  • Provocări comune de administrare Spark
  • Instrumente și tehnici de diagnosticare pentru depanare
  • Abordarea pas cu pas pentru rezolvarea problemelor comune
  • Cele mai bune practici pentru menținerea unui mediu Spark sănătos

Subiecte de administrare avansată

  • Integrarea cu alte instrumente de big data
  • Asigurarea unei disponibilități ridicate și a recuperării în caz de dezastru
  • Actualizarea și scalarea clusterelor Spark

Rezumat și pași următori

Cerințe

  • Cunoștințe de bază privind configurarea și gestionarea rețelelor
  • Familiaritate cu sistemul de operare Linux și cu interfața de linie de comandă
  • Interes pentru a învăța despre sistemele de calcul distribuite și gestionarea datelor mari

Audiență

  • Administratori de sistem
 35 ore

Numărul de participanți



Pret per participant

Mărturii (8)

Cursuri înrudite

Big Data Analytics in Health

21 ore

Categorii înrudite