beam
14 ore (usually 2 days including breaks)
Audience
Apache Beam este un model de programare unificat, open source, pentru definirea și executarea conductelor paralele de procesare a datelor. Puterea sa constă în capacitatea sa de a rula conducte de loturi și de streaming, execuția fiind realizată de unul dintre back-end-urile de procesare distribuite acceptate de Beam: Apache Apex , Apache Flink , Apache Spark și Go ogle Cloud Dataflow. Apache Beam este utilă pentru sarcinile ETL (Extract, Transform și Load), cum ar fi mutarea datelor între diferite suporturi de stocare și surse de date, transformarea datelor într-un format mai dorit și încărcarea datelor într-un nou sistem.
În acest training, instruit în direct (la fața locului sau la distanță), participanții vor învăța cum să implementeze SDK-urile Apache Beam într-o Java sau Python care definește o conductă de prelucrare a datelor pentru descompunerea unui set de date mari în bucăți mai mici pentru o prelucrare independentă și paralelă .
Până la sfârșitul acestui antrenament, participanții vor putea:
Formatul cursului
Notă
Machine Translated
Introduction
Installing and Configuring Apache Beam
Overview of Apache Beam Features and Architecture
Understanding the Apache Beam Programming Model
Running a sample pipeline
Designing a Pipeline
Creating the Pipeline
Executing the Pipeline
Testing and Debugging Apache Beam
Processing Bounded and Unbounded Datasets
Making Your Pipelines Reusable and Maintainable
Create New Data Sources and Sinks
Integrating Apache Beam with other Big Data Systems
Troubleshooting
Summary and Conclusion
We are looking to expand our presence in Romania!
If you are interested in running a high-tech, high-quality training and consulting business.
Apply now!

























.jpg)


.jpg)



.jpg)







.png)






