Schița de curs

Introducere

  • Apache Arrow vs parchet

Instalare și configurare Apache Arrow

Prezentare generală a Apache Arrow Caracteristici și arhitectură

Explorarea datelor cu Pandas și Apache Arrow

Explorarea datelor cu Spark și Apache Arrow

Explorarea datelor cu R și Apache Arrow

Explorarea datelor cu MapD și Apache Arrow

Alte Data Analysis Integrari

  • PySpark, fișiere Parquet pe S3 și Oracle tabele și Elasticsearch indici

Depanare

Rezumat și Concluzie

Cerințe

  • O înțelegere de bază a SQL
  • .
  • Familiaritate cu Python sau R
  • O oarecare familiaritate cu Apache Spark
  14 ore
 

Numărul de participanți


Dată început

Dată sfârșit


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Mărturii (5)

Cursuri înrudite

QGIS for Geographic Information System

  21 ore

Categorii înrudite