Schița de curs

Introducere

Principiile calculului distribuit

    Apache Spark Hadoop

Principiile Data Serialization

    Modul în care obiectul de date este transmis prin rețea Serializarea obiectelor Abordări de serializare Thrift Protocol Buffers Apache Avro structura datelor dimensiune, viteză, format caracteristici stocare persistentă a datelor integrare cu limbaje dinamice scheme de tastare dinamică gestionarea modificărilor datelor neetichetate

Data Serialization și calculul distribuit

    Avro ca subproiect al serializării Hadoop Java Serializarea Hadoop Serializarea Avro

Folosind Avro cu

    Hive (AvroSerDe) Porc (AvroStorage)

Portarea cadrelor RPC existente

Rezumat și Concluzie

Cerințe

  • O familiaritate generală cu calculul distribuit.
 14 ore

Numărul de participanți



Pret per participant

Mărturii (3)

Cursuri înrudite

Categorii înrudite