Schița de curs

Introducere

Prezentare generală a Apache Spark Caracteristici și arhitectură

  • Module Apache Spark: Spark SQL, Spark Streaming, MLlib, GraphX
  • RDD, Dataframes, drive-workers, DAG, etc.

Configurarea Apache Spark pe .NET

  • Pregătirea mașinii virtuale Java
  • Rularea .NET pentru Apache Spark utilizând .NET Core

Noțiuni introductive

  • Crearea unui exemplu de aplicație consolă .NET
  • Adăugarea driverului Spark
  • Inițializarea unei SparkSession
  • Executarea aplicației

Pregătirea datelor

  • Construirea unui pipeline de pregătire a datelor
  • Efectuarea ETL (extragere, transformare și încărcare)

Machine Learning

  • Construirea unui model de învățare automată
  • Pregătirea datelor
  • Antrenarea unui model

Procesare în timp real

  • Procesarea datelor de flux în timp real
  • Studiu de caz: monitorizarea datelor senzorilor

Interogare interactivă

  • Lucrul cu Spark SQL
  • Analiza datelor structurate

Vizualizarea rezultatelor

  • Reprezentarea grafică a rezultatelor
  • Utilizarea instrumentelor de la terți pentru vizualizarea rezultatelor

Depanare

Rezumat și concluzii

Cerințe

  • Experiență de programare .NET folosind C# sau F#
  • .

Audiență

  • Dezvoltatorii
  21 ore
 

Numărul de participanți


Dată început

Dată sfârșit


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Mărturii (10)

Cursuri înrudite

Categorii înrudite