Schița de curs
Introducere în Apache Spark
- Rolul Spark în procesarea datelor mari
- Arhitectura Spark și componentele sale
Configurarea Apache Spark
- Cerințe hardware și software
- Proceduri de instalare pentru modurile standalone și cluster
- Bune practici de configurare pentru administratorii de sistem
Administrarea Clusterelor Spark
- Instrumente și tehnici de gestionare a clusterelor
- Monitorizarea aplicațiilor Spark și a resurselor clusterului
- Configurații de securitate și gestionarea utilizatorilor
Optimizarea Performanței
- Alocarea resurselor și planificarea
- Optimizarea Spark pentru performanță maximă
- Identificarea și rezolvarea gâturilor de strugure comune
Depanare și Rezolvare a Problemelor
- Provocări comune în administrarea Spark
- Instrumente și tehnici de diagnosticare pentru depanare
- Abordare pas cu pas pentru rezolvarea problemelor comune
- Bune practici pentru menținerea unui mediu Spark sănătos
Subiecte Avansate de Administrare
- Integrarea cu alte instrumente de date mari
- Asigurarea disponibilității ridicate și a recuperării în caz de dezastru
- Actualizarea și scalarea clusterelor Spark
Rezumat și Următorii Pași
Cerințe
- Cunoștințe de bază despre configurarea și gestionarea rețelelor
- Familiaritate cu sistemul de operare Linux și interfața de linie de comandă
- Interes în învățarea despre sistemele de calcul distribuit și gestionarea datelor mari
Publicul țintă
- Administratori de sistem
Mărturii (5)
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/cursului/prezentării/exercițiilor realizate, astfel încât să le putem examina și eventual să refacem ceea ce nu am înțeles inițial sau să îmbunătățim ceea ce deja am făcut.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
sarcini de exercițiu
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina