Schița de curs
Introducere
- Apache Spark vs Hadoop MapReduce
Prezentare generală a Apache Spark Caracteristici și arhitectură
Alegerea unei limbi Programming
Setarea Apache Spark
Crearea unei aplicații de probă
Alegerea setului de date
Rularea Data Analysis pe date
Prelucrarea datelor structurate cu Spark SQL
Prelucrarea datelor în flux cu Spark Streaming
Integrarea Apache Spark cu partea a 3-a Machine Learning Instrumente
Utilizarea Apache Spark pentru procesarea grafică
Optimizarea Apache Spark
Depanare
Rezumat și concluzii
Cerințe
- Experiență cu linia de comandă Linux
- O înțelegere generală a prelucrării datelor
- Experiență de programare cu Java, Scala, Python sau R
Audiență
- Dezvoltatorii
Mărturii (5)
O mulțime de exemple practice, modalități diferite de abordare a aceleiași probleme și, uneori, trucuri nu atât de evidente pentru a îmbunătăți soluția actuală.
Rafal - Nordea
Curs - Apache Spark MLlib
Tradus de catre o masina
The live examples
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Curs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Curs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift