Schița de curs

Introducere

  • De ce și cum adoptă echipele de proiect Hadoop
  • Cum a început totul
  • Rolul managerului de proiect în Hadoop proiecte

Înțelegerea arhitecturii Hadoop și a conceptelor cheie

  • HDFS
  • MapReduce
  • Alte piese ale ecosistemului Hadoop.

Ce constituie Big Data?

Diferite abordări ale stocării Big Data

HDFS (Hadoop Sistem de fișiere distribuite) ca fundație

Cum este procesat Big Data.

  • Puterea procesării distribuite

Prelucrarea datelor cu MapReduce

  • Cum sunt separate datele pas cu pas

Rolul clusterizării în procesarea distribuită la scară largă

  • Privire de ansamblu arhitecturală
  • Abordări de grupare

Gruparea datelor și proceselor dvs. cu YARN

Rolul non-relațional Database în Big Data Stocare

Lucrul cu Hadoop non-relațional Database: HBase

Prezentare generală arhitecturală a depozitării datelor

Gestionați-vă Data Warehouse cu Hive

Rulează Hadoop din Shell-Scripts

Lucrul cu Hadoop Streaming

Alte Hadoop Instrumente și utilități

Noțiuni introductive pentru un proiect Hadoop.

  • Demistificarea complexității

Migrarea unui proiect existent la Hadoop

  • Considerente legate de infrastructură
  • Extindere dincolo de resursele alocate

Hadoop Părțile interesate ale proiectului și seturile lor de instrumente

  • Dezvoltatori, cercetători de date, analiști de afaceri și manageri de proiect

Hadoop ca fundație pentru noi tehnologii și abordări

Observații de încheiere

Cerințe

  • O înțelegere generală a programării
  • O înțelegere a bazelor de date
  • Cunoștințe de bază de Linux
  • .
  14 ore

Numărul de participanți


Dată început

Dată sfârșit


Dates are subject to availability and take place between 09:30 and 16:30.

Pret per participant

Mărturii (3)

Cursuri înrudite

Categorii înrudite