Schița de curs

Avansată Analiză cu Spark

Big Data în Cloud

Studii de caz și cele mai bune practici

Procesare a datelor cu Apache Spark

Introducere în Google Colab și Apache Spark

Optimizarea fluxurilor de lucru Big Data

Rezumat și următoarele pași

Vizualizare și Collaboration în Google Colab

  • Integrarea Colab cu bibliotecile de vizualizare populare
  • Lucruri colaborative cu notebook-uri Colab
  • Împărtășirea și exportarea rezultatelor
  • Integrarea Google Colab cu instrumentele bazate pe cloud
  • Utilizarea stocării în cloud pentru date mari
  • Lucrul cu Spark în mediile distribuite de cloud
  • Aprendizaj automatizat cu Spark MLlib
  • Realizarea analizei de date în timp real
  • Calcul distribuit cu Spark
  • Perspectivă asupra Google Colab
  • Introducere în Apache Spark
  • Configurarea Spark în Google Colab
  • Revizuire a aplicațiilor cu date mari din lumea reală
  • Studii de caz folosind Apache Spark și Colab
  • Cele mai bune practici pentru analiza datelor mari
  • Afinarea Spark pentru performanță
  • Optimizarea utilizării memoriei și stocării
  • Scalare a fluxurilor de lucru pentru seturi mari de date
  • Lucrul cu RDD-uri și DataFrames
  • Încărcarea și procesarea seturilor mari de date
  • Utilizarea Spark SQL pentru interogarea datelor structurate

Cerințe

Audiență

  • Cunoștințe de bază în domeniul științei datelor
  • Familiaritate cu Apache Spark
  • Competențe de programare în Python
  • Științiști ai datelor
  • Ingineri ai datelor
  • Cercetători care lucrează cu date mari
 14 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Upcoming Courses

Categorii înrudite