Vă mulțumim că ați trimis solicitarea! Un membru al echipei noastre vă va contacta în scurt timp.
Vă mulțumim că ați trimis rezervarea! Un membru al echipei noastre vă va contacta în scurt timp.
Schița de curs
Introducere:
- Apache Spark în Hadoop Ecosistem
- Scurtă introducere pentru python, scala
Bazele (teorie):
- Arhitectură
- RDD
- Transformare și acțiuni
- Etapă, Sarcină, Dependențe
Folosind Databricks mediu înțelegeți elementele de bază (atelier practic):
- Exerciții folosind RDD API
- Funcții de bază de acțiune și transformare
- PairRDD
- A te alatura
- Strategii de stocare în cache
- Exerciții folosind API-ul DataFrame
- SparkSQL
- DataFrame: selectați, filtrați, grupați, sortați
- UDF (funcție definită de utilizator)
- Privind API-ul DataSet
- Streaming
Folosind mediul AWS, înțelegeți implementarea (atelier practic):
- Elementele de bază ale AWS Glue
- Înțelegeți diferențele dintre AWS EMR și AWS Glue
- Exemple de locuri de muncă în ambele medii
- Înțelegeți argumentele pro și contra
Suplimentar:
- Introducere în Apache Airflow orchestrație
Cerințe
Competențe de programare (preferabil python, scala)
SQL de bază
21 ore
Mărturii (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Curs - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Curs - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift