Schița de curs
Introducere
- Apache Spark vs Hadoop MapReduce
Prezentare generală a caracteristicilor și arhitecturii Apache Spark
Alegerea unui limbaj de programare
Configurarea Apache Spark
Crearea unei aplicații de exemplu
Alegerea setului de date
Efectuarea analizei datelor pe setul de date
Procesarea datelor structurate cu Spark SQL
Procesarea datelor de streaming cu Spark Streaming
Integrarea Apache Spark cu instrumente de învățare automată de la terți
Utilizarea Apache Spark pentru procesarea graficelor
Optimizarea Apache Spark
Depanare
Rezumat și concluzii
Cerințe
- Experiență cu linia de comandă Linux
- O înțelegere generală a procesării datelor
- Experiență de programare în Java, Scala, Python sau R
Public țintă
- Dezvoltatori
Mărturii (3)
Mi-a plăcut că a fost practic. Am adorat să aplic cunoștințele teoretice cu exemple practice.
Aurelia-Adriana - Allianz Services Romania
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/cursului/prezentării/exercițiilor realizate, astfel încât să le putem examina și eventual să refacem ceea ce nu am înțeles inițial sau să îmbunătățim ceea ce deja am făcut.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina